WO2006095409A1 - Information retrieving device, computer program, and recording medium - Google Patents

Information retrieving device, computer program, and recording medium Download PDF

Info

Publication number
WO2006095409A1
WO2006095409A1 PCT/JP2005/003928 JP2005003928W WO2006095409A1 WO 2006095409 A1 WO2006095409 A1 WO 2006095409A1 JP 2005003928 W JP2005003928 W JP 2005003928W WO 2006095409 A1 WO2006095409 A1 WO 2006095409A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
search
user
registration information
web page
Prior art date
Application number
PCT/JP2005/003928
Other languages
French (fr)
Japanese (ja)
Inventor
Shinya Takei
Original Assignee
Mars Flag Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mars Flag Corporation filed Critical Mars Flag Corporation
Priority to PCT/JP2005/003928 priority Critical patent/WO2006095409A1/en
Priority to JP2007506942A priority patent/JP4527770B2/en
Publication of WO2006095409A1 publication Critical patent/WO2006095409A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Definitions

  • the present invention relates to an information search apparatus, an information search method, and a program for causing a computer to execute the method for searching a website on the Internet based on a keyword input by a user.
  • Robot-type search engines and directory-type search engines have been generally known as search engines that perform full-text search of Web sites (WEB pages) on the Internet according to user search instructions.
  • a robot-type search engine When a keyword related to information to be searched is specified, a robot-type search engine periodically searches information on all WWW servers that can be found on the Internet using a WWW search program called a WEB robot or spider. The information is automatically collected and collected. Since this robot-type search engine automatically collects data from websites around the world by a computer, it has the advantage of a large amount of information.
  • Locator is artificially classified by field such as art, business, education, etc., and the user searches by specifying keywords by field.
  • this directory-type search engine information is classified by field, so users can use it like an occupational phone book, and it has the advantage that it is convenient when searching for power by deciding a field.
  • search robot performs a search, even if different users search, as long as the search is performed with the same key key, only the same search result can be obtained, and all users having different profiles and preferences can be obtained. There is a problem that satisfactory search results are rarely obtained.
  • Patent Document 1 a system that provides a search result that matches the user's preference has been proposed (see Patent Document 1).
  • the user specifies the information to handle the information.
  • categories can be assigned and classified based on user intentions.
  • the degree of coincidence between users of the information in each power category the similarity of preference between the user and other users is evaluated and determined, and the other users whose similarity is determined to be high Can be introduced to the user. According to this, since the system power is introduced to the information evaluated by other users with similar preferences, the user can save time and cost for searching for information.
  • Patent Document 1 Japanese Patent Application No. 2000-187666
  • the provision is received based on the similarity of the user's preference.
  • the ability to provide unknown information to users who are searching for keywords When searching for keywords, trends in users with common preferences (for example, which pages a user with a common hobby refers to) It is not possible to select the information to be provided by using the latest trend of the page (for example, whether it has been recently updated or has been particularly popular recently) as an index.
  • the present invention has been made in view of such problems, and an object thereof is to make a search result at the time of keyword search more valuable to a user.
  • the present invention for solving the above-described problems is based on the search information input by the client terminal! Searches for information on Web pages on the Internet and transmits the search result to the client terminal.
  • An information search apparatus for storing registration information storage means for storing registration information relating to a Web page, receiving means for receiving the search information from the client terminal, and searching for a Web page related to a keyword included in the search information
  • First search result generating means for searching for information and generating a first search result, and registration information relating to the Web page included in the first search result stored in the registered information storage means From the selection means for selecting the first registration information using setting information relating to the presence / absence of use of the registration information included in the search information, and based on the first registration information,
  • Calculation means for calculating the weight value of the Web page included in the first search result for each Web page, and the Web page included in the first search result based on the weight value calculated for each Web page.
  • Rank determining means for determining the rank of the page, second search result
  • FIG. 1 is a diagram corresponding to an example of the overall configuration of a system corresponding to an embodiment of the present invention.
  • FIG. 2 is a diagram corresponding to an example of a configuration of a client 101 corresponding to the embodiment of the present invention.
  • FIG. 3 is a diagram corresponding to an example of a configuration of a server 103 corresponding to the embodiment of the present invention.
  • FIG. 4A is a diagram showing an example of registration contents of a user database 104 corresponding to the embodiment of the present invention.
  • FIG. 4B is a diagram showing an example of registered contents in the bookmark database 105 corresponding to the embodiment of the present invention.
  • FIG. 4C is a diagram showing an example of registered contents in the URL database 106 corresponding to the embodiment of the present invention.
  • FIG. 4D is a diagram showing another example of registered contents in the URL database 106 corresponding to the embodiment of the present invention.
  • FIG. 5 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when an online bookmark is used, corresponding to the embodiment of the present invention.
  • FIG. 6A is a diagram showing an example of a display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
  • FIG. 6B is a diagram showing another example of a display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
  • FIG. 6C is a diagram showing still another example of the display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
  • FIG. 7 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when search processing corresponding to the embodiment of the present invention is executed.
  • FIG. 8 is a flowchart corresponding to an example of search processing in the server 103, corresponding to the embodiment of the present invention.
  • FIG. 1 is a block diagram showing the overall configuration of a search system corresponding to this embodiment.
  • Clients 101a, 101b, and 101c (hereinafter collectively referred to as “client 101”) that are operated by a user to browse content, a server 103 that performs search, and a content server 108 that publishes content, respectively.
  • client 101 Clients 101a, 101b, and 101c
  • server 103 that performs search
  • content server 108 that publishes content, respectively.
  • a user database 104, a bookmark database 105, a URL database 106, and a search database 107 are connected to the server 103 !.
  • the client 101 is an information processing apparatus as a client terminal that can be operated by a user and browse content published on the Internet, and includes a notebook computer, a desktop computer, a portable information terminal, a cellular phone, and the like. . It is assumed that the client 101 is installed with software capable of displaying content described in a predetermined page description language (for example, HTML, XML, PDF, PS, etc.) on the display screen. In the following embodiment, for the sake of simplicity, a case where the so-called Internet browser power S is installed as the software will be described as an example.
  • a predetermined page description language for example, HTML, XML, PDF, PS, etc.
  • the client 101 is connected to the Internet 102 via a LAN that is an access means including a network cable such as Ethernet (registered trademark).
  • the access means to the network 102 is not limited to an Ethernet (registered trademark) cable.
  • the access means may be constituted by a communication cable conforming to the RS232C interface or a wireless communication means such as a wireless LAN.
  • the server 103 and the content server 108 described later are also provided with similar access means.
  • the Internet 102 is a network in which networks all over the world are connected to each other.
  • the Internet 102 may be a network that can be connected only within a specific thread and fabric such as an intranet.
  • the server 103 serves as an information search device that provides a search service to the client 101.
  • the information processing apparatus manages information stored in the user database 104, bookmark database 105, URL database 106, and search database 107.
  • the server 103 periodically accesses a Web site that can be browsed on the Internet 102, collects the URL, title, and full-text data included therein, and updates the URL database 106 and the search database 107.
  • the update of the bookmark database 105 is monitored, and when a new URL is added to or deleted from the user bookmark, the corresponding URL database 106 is updated. Do. In addition, the selection operation of the URL registered in the bookmark in the client 101 is monitored, and the reference count of each user is recorded.
  • the server 103 is connected to the user database 104, the bookmark database 105, the URL database 106, and the search database 107 by, for example, LAN.
  • the user database 104, the bookmark database 105, the URL database 106, and the search database 107 are information processing apparatuses in which predetermined database software is installed, and manage various data.
  • the user database 104 manages information on user data.
  • the bookmark database 105 manages bookmark data for each user.
  • the URL database 106 uniformly manages registration information related to pages registered by each user in the bookmark.
  • the search database 107 manages information for search processing.
  • the content server 108 is an information processing apparatus that provides content such as a web page, and for example, software such as a web server is installed.
  • the server 103, the user database 104, the bookmark database 105, the URL database 106, and the search database 107 are each realized by a physically independent information processing device.
  • the embodiment of the present invention is not limited to this.
  • these may be realized by a single information processing device.
  • the user database 104, the bookmark database 105, the URL database 106, and the search database 107 can be described as being connected to the server 103 via a LAN or the like. You may take the form which can communicate. ⁇ Configuration of information processing apparatus>
  • FIG. 2 is a block diagram illustrating an example of the hardware configuration of the client 101.
  • the user database 104, the bookmark database 105, the URL database 106, and the search database 107 as the information processing apparatus described above may be configured with the same or equivalent hardware configuration.
  • reference numeral 200 denotes a CPU, which is stored in a hard disk device (hereinafter referred to as HD) 205 and executes an application program, an operating system (OS), a control program, etc. Control to temporarily store information, files, etc. necessary for execution.
  • HD hard disk device
  • OS operating system
  • control program etc. Control to temporarily store information, files, etc. necessary for execution.
  • Reference numeral 201 denotes a ROM that stores therein various data such as a program such as a basic I / O program, font data used for document processing, and template data.
  • 202 is a RAM for temporarily storing various data, and functions as the main memory, work area, etc. of the CPU 200.
  • [0028] 203 is an external storage drive for realizing the access to the recording medium, it can be force s load media (recording medium) 204 a program stored in such in the computer system.
  • media 204 for example, a flexible disk (FD), CD-ROM, CDR, CD-RW, PC card, DVD, IC memory card, MO, memory stick, etc. can be used.
  • Reference numeral 205 denotes an external storage device, which uses an HD functioning as a large-capacity memory in this embodiment.
  • the HD 205 stores application programs, OS, control programs, related programs, and the like.
  • Reference numeral 206 denotes an instruction input device, which corresponds to a keyboard, a pointing device (such as a mouse), and a touch panel. Using the instruction input device 206, the user instructs the client 101 to input a command or the like for controlling the device.
  • Reference numeral 207 denotes a display which displays a command input from the instruction input device 206, a response output of the client 101 in response thereto, and the like.
  • Reference numeral 209 denotes a system bus, which controls the flow of data in the information processing apparatus.
  • 20 8 is an interface (hereinafter referred to as IZF), and exchanges data with external devices via this IZF208.
  • IZF interface
  • the program may be loaded into the RAM 202 from the HD 205 in which the program is already installed. It is also possible to record the program according to the present embodiment in the ROM 201, configure it as a part of the memory map, and execute it directly by the CPU 200.
  • FIG. 3 is a block diagram showing a device configuration of the server 103. Functions and applications of CPU300, ROM301, RAM302, external storage drive 303, media 304, HD305, instruction input device 306, display 307, I / F308, system bus 309, and their relationship are shown in Fig. 2. Are the same as or equivalent to those described above. Note that in FIG. 3, database 310 is connected to system bus 309. Here, the database 310 is a generic term for the user database 104, the bookmark database 105, the URL database 106, and the search database 107.
  • FIG. 4A is a diagram for explaining an example of the structure of user data stored in the user database 104.
  • User data is composed of various information related to the characteristics and attributes of individual users.
  • 401 is a user ID, which is an identifier given to the unique to uniquely identify each user.
  • Reference numeral 402 denotes a password, which is used for authentication when each user accesses registered personal information or uses a bookmark.
  • 403 is the user name
  • 404 is the user's e-mail address
  • 405 is the age
  • 406 is the gender
  • 407 is the region where the user is active or resides
  • 408 is the occupation
  • 409 is unmarried
  • 410 is the residence type
  • 411 is the year 412 is private car ownership
  • 413 is a hobby.
  • Each data is provided in advance by the user and registered as user data. Also, the above content is the user data It is given as an example, and it is not necessary that all of these are registered, and other information that characterizes the user may be registered.
  • the bookmark is created and updated by the user. All bookmark data is stored in the bookmark database 105 connected to the server 103 for each user, and when the user starts the web browser on the client 101, It is downloaded to the client 101 and displayed on the web browser.
  • a bookmark is composed of a URL and a folder for storing the URL as a specific group in a known directory structure. That is, each URL is registered in a directory tree for each user (hereinafter referred to as a bookmark directory), and may be directly under the bookmark directory or in an arbitrarily created folder.
  • FIG. 4B is a diagram showing an example of management of information related to pages registered in bookmarks.
  • the user ID is an identifier of the user who uses the bookmark, and corresponds to the user ID 401 in FIG. 4A.
  • the user can be associated with the bookmark.
  • information for identifying a Web page to be registered is registered.
  • the URL database 106 is used to manage information about each page in a unified manner, so the URL of the corresponding page is not stored in each user bookmark. Instead, an identification number (URL—ID) for managing the page is stored in the URL database 106. If the URL database 106 is not used, the URL itself may be registered.
  • URL—ID identification number
  • Reference numeral 423 denotes a bookmark name given to each page.
  • the bookmark name 423 may be a name arbitrarily set when the user registers a bookmark, or may be a name originally assigned to the page.
  • Reference numeral 424 indicates the date and time when the page was created (corresponding to the date and time when the page was first published on the network 102).
  • 425 indicates the date and time when the page was updated.
  • 426 indicates the date and time when the user referred to the page most recently.
  • Reference numeral 427 denotes the total number of times the user refers to the page.
  • the total number of references refers to the total number of times the user has referred to the page so far.
  • Reference numeral 428 indicates the number of times the user has referred to the page recently.
  • the most recent reference count is This is the total number of times the page was viewed by the user during the most recent predetermined period (eg, 1 week, 1 month, etc.).
  • a directory table is prepared in the bookmark database 105 for the relationship between the pages registered in the bookmark and information on the folder storing the page.
  • the server 103 periodically monitors the update of each page registered as a bookmark as described above, and updates the contents of the update date and time of 425 when there is an update.
  • FIG. 4C is a diagram illustrating an example of management of information regarding pages in the URL database 106.
  • 422 represents an ID (identifier) given to the URL, and corresponds to the URL—ID 422 in FIG. 4B.
  • Reference numeral 429 denotes a URL to which a URL—ID422 is given. 43 0 indicates the title inherent in the Web content corresponding to the URL.
  • the creation date and update date are the same as in Figure 4B.
  • 431 indicates the last reference date and time, and indicates the date and time when one of the bookmark users referred to the page most recently.
  • Reference numeral 432 represents the total of the total number of times 427 of the plurality of users, that is, the total number of times the page is referred to by the plurality of users.
  • the most recent reference count 433 represents the total of the recent reference counts 428 of a plurality of users, that is, the total number of times that the page has been referred to by a plurality of users within the most recent predetermined period. Therefore, the “predetermined predetermined period” is the same as in FIG. 4B. For example, recently popular pages that are popular, but popular, have a higher recent reference count of 433, so it is possible to determine the most recent degree of popularity for each page. 434 is the number of increased anchors, and indicates the number of anchors added within the most recent predetermined period for the page. In the present embodiment, an anchor refers to link information to another page embedded in a page. Further, “the most recent predetermined period” is the same as described above.
  • FIG. 4D is a diagram illustrating another example of management of information related to pages in the URL database 106.
  • Reference numeral 422 denotes a URL ID assigned to each page.
  • Reference numeral 440 denotes user data, in which individual user data shown in FIG. 4A is registered.
  • Reference numeral 441 denotes the total number of times of reference, and the total number of times of reference with respect to the page, which is aggregated for each user data, is registered.
  • Reference numeral 442 denotes the number of the latest references, and the total of the number of references for the most recent predetermined period with respect to the URL, which is aggregated for each user data, is registered.
  • the “predetermined predetermined period” is the same as described above.
  • 443 is the number of bookmarks registered, and a value obtained by adding the number of users who register the page as a bookmark to! / Speak for each user data is registered.
  • Fig. 4D the user data 440 is reached! /, Age 405, hobby 413, job type 408 power ⁇ power that describes the registered f column
  • age 405 is considered, "10s", " The total number of referrals 441, the latest reference count 442, and the number of bookmark registrations 443 are registered for each age group, such as “20's”.
  • the total number of users in their teens who referred to the URL is 100 times
  • the total number of users in their 20s who referred to the URL is 300 times.
  • the user data 440 includes a plurality of items other than "age”, "hobby", and "job type". For each of these user data, the total number of reference times 441, the latest reference 442 times and 443 bookmarks are registered. The total number of reference times 441, the number of latest reference times 442, and the number of bookmark registrations 443 are as follows: It can be obtained by using the data shown in FIGS. 4A and 4B.
  • registration information the individual registered contents of the database illustrated in FIGS. 4A to 4D are referred to as registration information.
  • the search database 107 manages information for search processing as search information for searching Web pages related to keywords for which user power is also provided, and is collected from the Web site on the Internet 102.
  • the retrieved search data is registered.
  • the search data may include other data that mainly consists of the identifier, keyword, attribute, data acquisition time, data acquisition URL, URL title, full text data (Description), etc. of each search data.
  • FIG. 5 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when an online bookmark is used in the client 101.
  • the bookmark data request is notified to the server 103 together with the user ID 401 (501).
  • the bookmark database 105 is searched based on the notified user ID 401, and the bookmark data of the user is selected (step S552).
  • the selected bookmark data is transmitted from the server 103 to the client 101 (502).
  • the client 101 displays the activated web browser on the display 207, and displays bookmark information based on the bookmark data transmitted from the server 103 in the bookmark display area of the web browser (step S553).
  • the client 101 monitors whether or not the user has received an operation on the bookmark, and if the operation is received (“YES” in step S554), the bookmark operation content is displayed to the server 103. Notification is made (503).
  • the operation of the bookmark that accepts user power includes, for example, selection of a URL registered in the bookmark, addition of a new URL, editing (including deletion) of registered URL information, and the like.
  • the server 103 receives the bookmark operation content. Update each database based on the contents. If the notification is, for example, a notification that a user has selected a URL, the reference date and time 426 for the corresponding URL, the total reference count 427, the latest reference count 428, the last reference date and time 431, the total reference count 432, The latest reference count 433, the total reference count 441, and the latest reference count 442 are updated.
  • a termination notification is transmitted from the client 101 to the server 103 (504), and a termination response is returned from the server 103 (505).
  • the contents of the bookmark database 105 and the URL database 106 managed by the server 103 are always updated based on the operation accepted by the user.
  • FIGS. 6A to 6C are diagrams showing examples of screens displayed on the display 207 when the user power client 101 executes search processing.
  • a predetermined URL is specified and a search page provided by the server 103 is accessed.
  • the screen first displayed on the display 207 is a screen 600 as shown in FIGS. 6A to 6C.
  • the screen 600 is largely divided into a search screen 601 and a bookmark display area 600.
  • bookmark display based on the bookmark data provided from the server 103 is performed, and the user can select and browse a page registered in the bookmark.
  • the server 103 provides a search service with the name “O ⁇ search”.
  • the search screen 601 includes a keyword input area 602, a search execution button 603, an option 604, and A setting button 605 is displayed.
  • the keyword input area 602 is an area for receiving an input of a keyword that the user wants to search.
  • the search execution button 603 is a button for instructing the server 103 to perform a search process according to the contents of the set option for the input keyword.
  • Option 604 indicates whether to sort the search results based on page information or user data, as shown in Figure 6C.
  • the user power is also accepted. In other words, when “use” is selected, a search using the content set as an option is performed. On the other hand, if “do not use” is selected, normal search processing is executed without using the content set as an option, and this search result output S client 101 is notified.
  • FIG. 6B is a screen displayed on the display 207 when the setting button 605 is selected in FIG. 6A. This screen is a screen for confirming whether or not the user is registered in the user database 104.
  • reference numeral 611 denotes a display field for accepting an input regarding the presence / absence of user registration from a user who wants to perform a search.
  • “Yes” or “No” can be selected.
  • input fields 612 and 613 for accepting input of “user name” and “password” are displayed.
  • “None” is selected, these input fields 612 and 613 are not displayed at all as the force to be grayed out.
  • Reference numeral 614 denotes a determination button, which is operated when confirming input contents.
  • a cancel button 615 is operated when the user wants to return to the screen shown in FIG. 6A. If the user registration 611 is set to “None” when the OK button 614 is operated, the screen is switched to FIG. 6C without transmitting data to the server. On the other hand, if “user name” and “password” are accepted in the setting of the user registration 611 force S “Yes”, the accepted data is transmitted to the server 103.
  • the server 103 searches the user database 104 for a user name 403 and a password 402 that match the “user name” and “password” received from the client 101.
  • a matching “user name” is registered, it is registered in the user database 104, and the presence / absence of user data and the user ID 401 are notified from the server 103 to the client 101.
  • the client 101 Upon receiving the notification from the server 103, the client 101 displays the screen in FIG. 6C.
  • an error message is notified from the server 103 to the client 101.
  • the client 101 receives the error message from the server 103, the client 101 displays the screen of FIG. 6B and accepts the input of “user name” and “password” again.
  • FIG. 6C is a screen displayed on the display 207 after the enter button 614 is selected in FIG. 6B.
  • this screen receives setting of option information used when searching in the server 103, more specifically, designation of registration information used for calculating the weight value of each page included in the search result. It is also a screen for attaching.
  • the option input screen 620 roughly shows page information 621, user data 622, and manaise 623.
  • Items that can be set for the page information 621 include the update date, the total number of references, the number of latest references, the number of increased anchors, and the number of bookmark registrations. These items correspond to the registration information of the update date and time 425, the total reference count 432, the latest reference count 433, the increased anchor count 434, and the bookmark registration count 435 of Fig. 4C registered in the URL database 106, respectively. . Therefore, when any of these items is selected, the corresponding registration information is used when determining the display order for the pages included in the search results in the server 103 (as will be described later with reference to FIG. 8). Used for
  • items that can be set for the user data 622 include age, sex, regional attributes, occupation, unmarried, annual income, presence of a car, and hobbies. These items are registered information related to the specified user data among the registered information for the total reference count 441, the latest reference count 442, and the bookmark registration count 443 in FIG. 4D registered in the URL database 106, respectively. It corresponds.
  • the generation to which the user belongs is determined based on the age of the user who made the designation out of the age of the user data 440 in FIG. 4D. And corresponding registration information is specified. Therefore, these items When either one is selected, the corresponding registration information is used when determining the display order of pages included in the search result in the server 103 (as will be described later with reference to FIG. 8).
  • Omakase 623 can be selected when the user does not specify the page information 621 or the user data 622. If Random 623 is selected, for example, the search may be performed using all option information, or specific page information 621 and user data 622 may be set in advance and You may search using settings
  • the power that items that can be set for the page information 621 and the user data 622 are displayed.
  • Such a display is registered in the user database 104 and each item of the user data 622 is displayed.
  • the user data must be registered for the setting items without omission.
  • some users may not be able to be registered in the user database 104.
  • a setting is accepted for the setting item of the user data 622, it cannot be used for the search.
  • Such a user should have set the user registration 611 to “none” in the screen of FIG. 6B. Therefore, it is preferable that only the page information 621 is displayed on the screen 620 and the user data 622 is grayed out corresponding to the setting contents. According to this, even a user who is not registered in the user database can be searched using at least the page update date and the latest reference count.
  • the user can confirm the contents of the option input by the OK button 624.
  • the search screen 601 returns to the contents shown in FIG. 6A. If the cancel button 625 is selected, the screen returns to the screen in FIG. 6A. At that time, the option settings may be reset, or the previous input contents may be retained.
  • the client 101 when the URL of the search service page provided by the server 103 is selected ("YES" in step S751), the client 101 sends a request to the server 103. A request for search screen information is notified (701). In response to the request for search screen information from the client 101, the server 103 transmits search screen information as search information generation information for generating search information to be described later in the client 101 (702). Upon receiving the search screen information from the server 103, the client 101 displays a search screen as shown in the search screen 601 in FIG. 6A on the display 207 (step S752).
  • step S753 an input such as whether or not the user power keyword or option setting is accepted is accepted (step S753), and when option setting is performed, the screen of FIG. It is determined whether or not the force is applied (step S754). If the option is not set, the following steps S753 and S756 are skipped and the process proceeds to step S757.
  • step S756 In the screen displayed in FIG. 6B, if the user registration 611 is set to “none”, it means that “user registration is present” is not set (in step S754! / “NO”), proceed to step S756. On the other hand, when the user registration 611 is set as “present” and “user name” and “password” are entered in the input fields 612 and 613, this means that “user registration is present” (step S754). Therefore, the input information is transmitted to the server 103 as user authentication information (703).
  • the server 103 includes "user name” and "password” transmitted from the client.
  • User authentication information is used to verify user authentication, that is, whether or not the user is registered in the user database 104 (step S755). If the user is registered as a result of the verification, the user authentication result including the user ID 401 and the information on the presence or absence of the user data registered in the user database 104 for the user is sent to the client 101. It is transmitted (704). If the user is not registered, it is transmitted to the user authentication result S client 101 including an error message (704).
  • step S756 an option input screen as shown in FIG. 6C is displayed to accept an option input.
  • a search execution instruction by selecting the search execution button 603 is accepted (step S757).
  • the server 103 receives the contents of the keyword and option settings received in steps S753 and S756, and the user authentication result (704), it will be displayed.
  • the search information including the user ID 401 included in is transmitted (705).
  • a predetermined code indicating that the user is not registered may be included in the search information instead of the user ID 401 and transmitted.
  • the server 103 Upon receiving the search information transmitted from the client 101, the server 103 performs a search process based on the key word, and creates a search result based on the contents of the option settings (step S758). ) And the search result is transmitted to the client 101 (706). When the client 101 receives the search result from the server 103, the client 101 displays the received search result on the search screen 601 of the display 207 (step S759).
  • step S751 the processing from step S751 is resumed. If the user finishes browsing the Web browser (“YES” in step S760), the client 101 sends a termination notice to the server 103 (707), and the server 103 returns a termination response. (708).
  • FIG. 8 is a flowchart corresponding to an example of search processing in the server 103.
  • step S801 the server 103 receives the search information transmitted from the client 101, and at the same time receives the search request from the received search information (the search request).
  • the user ID 401 of the requesting user) is extracted.
  • step S802 user data is acquired from the user database 104 based on the extracted user ID 401.
  • the search requesting user is not registered in the user database 104, the code indicating the unregistered user is included, but the user ID 401 is not included in the search information! /.
  • the option setting 604 in FIG. 6A is set to “not use”, the user authentication result (704) in FIG. 7 is not received. Therefore, the user ID 401 is not included in the search information.
  • user data is not acquired for these users.
  • step S803 the search database 107 is searched by a known method based on the keywords included in the search information, and data matching the search conditions based on the keywords is acquired as the search result 1 in step S804.
  • This search result 1 is the search result obtained by the search process. It is the user data (that is, job title and age of the search requesting user) and page information (update date and time, reference count, etc.) Regardless of the criteria, the degree of association with the keyword is determined based on the criteria such as the keyword specified in the page and how many words are similar to the keyword, and the pages are arranged in the order of the association. Obtained as a thing.
  • step S805 the contents of the option setting 604 of the search request user are identified based on the search information! /. If the option setting 604 is set to “not use” in the option setting 604, the process proceeds to step S816 and the search result 1 is transmitted to the client 101. On the other hand, if “use” is set, the process proceeds to step S806, and the point Ps of each page is calculated based on the ranking of the search result 1. For example, if search result 1 contains 100 pages! /, Then based on the ranking! /, The head will also be scored as 1 00, 99, 98 ... 1 Power S can be. Only the top 10 points may be given points of 100, 90, 80 ... 10. In any case, the weight based on the ranking of the search result 1 is given to each page included in the search result 1 as Ps.
  • step S807 the order of pages included in the search result 1 is set to Nu, and Nu is set to 1.
  • step S808 the page with the Nu rank in search result 1 is selected, and the URL data for the page is based on the URL of the page. If information is registered in the base 106, all the registered information is acquired.
  • step S809 based on the contents of the option setting set in the search information and the user data acquired in step S802, if there is the user data, from the acquired registration information, Narrow down the registration information used for weighting the page.
  • steps S808 and S809 the force of reading out all of the registration information and then narrowing down this is only described as an example.
  • the corresponding registration information may be acquired directly from the URL database 106 based on the contents of the option settings set in the search information and the user data.
  • the page itself is not registered in the URL database 106, or when the page itself is registered but information corresponding to the narrowed registration information is not registered (for example, the The page may not be accessed by anyone other than a specific hobby.
  • this point Pu it is possible to reflect the relationship between the page and the search requesting user and the usefulness of the information on the page in the search result.
  • the total reference count 441, the latest reference count 442, and the bookmark registration count 443 it is registered in the page or bookmark that many other users who have selected the same type of job as the search request user refer to. Have Can be ranked higher in the search results.
  • Pr can be used as a numerical value as it is when it is counted numerical information such as the total number of times of reference.
  • the Pr value can be obtained by obtaining the difference from the current date and time, and further obtaining the reciprocal thereof. In any case, it is only necessary to convert the Pr value so that it becomes closer to the current date and time.
  • the weighting value Pw may be given uniformly for all registration information, or may be given a value for specific registration information.
  • the weighting value Pw of the total number of reference times 441 is set to 100 and the weighting value of the total number of reference times 432 is set to 10.
  • a different weighting value from other registration information may be prepared.
  • step S811 the points Pu for each piece of registration information calculated in step S810 are summed to calculate Pust.
  • This point Pust is the weight given to each page based on the registration information.
  • Puall Ps + Pust ′ N (N is a predetermined number).
  • N is a predetermined number.
  • the ranking of search result 1 need not be considered at all.
  • step S815 based on the Puall value calculated in step S814! /,
  • Puall decides the order of the pages in order of size, sorts the order of search result 1 and creates search result 2.
  • search result 2 (or search result 1 if directly transferred from step S805) is transmitted to client 101.
  • the server 103 corresponding to the present embodiment can perform search processing based on information other than the user data of the search request user and the contents of the page, and create a search result. I'll do it.
  • user data to be used can be designated in advance by option setting 604.
  • the user himself / herself narrows down user data that should be actively used, and is highly relevant to the keyword originally intended by the user.
  • the page is weighted based on the number of most recent references !, so the page is a page whose total number of references is not very large due to recently launched power.
  • the number of times of the most recent reference is naturally larger than other pages. The point (Pu) will be higher. Therefore, such pages are ranked higher in the search results.
  • it is normal that such a page does not increase in the number of the latest reference. Therefore, by using this number of the latest reference, it is possible to exclude the search result power. It becomes possible.
  • the above processing (for example, processing according to the flowchart shown in FIG. 5, FIG. 7 or FIG. 8 above) is stored as a program in a storage medium such as a CD-R, ROM, DVD-ROM, MO, etc.
  • This computer can perform the above processing by loading the stored program into the computer (installing or copying), or downloading a predetermined server power via the network. Therefore, it is clear that this storage medium is also within the scope of the present invention.
  • the present invention is not limited to the above-described embodiment, and various changes and modifications can be made without departing from the spirit and scope of the present invention. Therefore, in order to make the scope of the present invention public, the following claims are attached.

Abstract

An information retrieving device for retrieving the information of a Web page on the Internet on the basis of retrieval information inputted from a client terminal and for transmitting the retrieval result to the client terminal. The weighted value of the Web page is calculated by utilizing such registered information relating to the Web page as is contained in a first retrieval result that the Web page relating to a keyword was retrieved from the retrieval information. The order of the Web page contained in the first retrieval result is determined on the basis of the weighted value calculated, to create a second retrieval result. This second retrieval result created is transmitted to the client terminal.

Description

明 細 書  Specification
情報検索装置、コンピュータプログラム及び記憶媒体  Information retrieval apparatus, computer program, and storage medium
技術分野  Technical field
[0001] 本発明は、ユーザから入力されたキーワードに基づいてインターネット上の WEB サイトを検索する情報検索装置、情報検索方法及びその方法をコンピュータに実行 させるプログラム〖こ関する。  The present invention relates to an information search apparatus, an information search method, and a program for causing a computer to execute the method for searching a website on the Internet based on a keyword input by a user.
背景技術  Background art
[0002] ユーザの検索指示によりインターネット上の WEBサイト(WEBページ)を全文検索 する検索エンジンとしては、ロボット型検索エンジンやディレクトリ型検索エンジンが従 来から一般的に知られている。  [0002] Robot-type search engines and directory-type search engines have been generally known as search engines that perform full-text search of Web sites (WEB pages) on the Internet according to user search instructions.
[0003] ロボット型検索エンジンは、検索したい情報に関連するキーワードを指定すると、 W EBロボットやスパイダーと呼ばれる WWW探索プログラムを用いて,インターネット上 で見つけることのできる全 WWWサーバ上の情報を定期的に収集し、その情報の索 引付けを自動的に行うものである。このロボット型検索エンジンは,コンピュータによつ て自動的に全世界の WEBサイトのデータを収集して 、るため、情報量が多!ヽと 、う 利点を有している。 [0003] When a keyword related to information to be searched is specified, a robot-type search engine periodically searches information on all WWW servers that can be found on the Internet using a WWW search program called a WEB robot or spider. The information is automatically collected and collected. Since this robot-type search engine automatically collects data from websites around the world by a computer, it has the advantage of a large amount of information.
[0004] ディレクトリ型検索エンジンは、作業者が予め WEBサイトの URL(Uniform Resource  [0004] In a directory-type search engine, a worker uses a URL (Uniform Resource
Locator)を、芸術、ビジネス、教育等のように分野別に人為的に分類しておき、ユー ザは分野別にキーワードを指定して検索するものである。このディレクトリ型検索ェン ジンでは情報を分野別に分類しているので、ユーザは職業別電話帳のような使い方 ができ、分野を決めて力も探す場合に便利であると 、う利点を有して 、る。  Locator) is artificially classified by field such as art, business, education, etc., and the user searches by specifying keywords by field. In this directory-type search engine, information is classified by field, so users can use it like an occupational phone book, and it has the advantage that it is convenient when searching for power by deciding a field. RU
[0005] しかしながら、このような従来の検索エンジンには次のような問題がある。ロボット型 検索エンジンの場合には、収集した情報量が多いという利点をもつ反面、検索ロボッ トは収集した WEBサイト情報に出てくる単語から単純に索引付けを行うため、キーヮ ード検索した場合に WEBサイトが何万件と出てしまう場合が多い。このため、ユーザ とは本来関係無いようなサイトまで検索結果として表示されてしまい、検索結果の品 質が低ぐユーザは目的の WEBサイトを絞り込むのに膨大な時間を要してしまうとい う問題がある。 However, such a conventional search engine has the following problems. In the case of a robot-type search engine, there is an advantage that a large amount of information is collected. On the other hand, a search robot simply indexes the words that appear in the collected website information. In many cases, there are tens of thousands of websites. As a result, sites that are not related to the user are displayed as search results, and users with low quality search results will need a huge amount of time to narrow down the target website. There is a problem.
[0006] また、検索ロボットが検索を行うので、異なるユーザが検索した場合でも同一キーヮ ードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好を有 するユーザの全てに対して満足の 、く検索結果が得られることは少な 、と 、う問題が ある。  [0006] Further, since the search robot performs a search, even if different users search, as long as the search is performed with the same key key, only the same search result can be obtained, and all users having different profiles and preferences can be obtained. There is a problem that satisfactory search results are rarely obtained.
[0007] ディレクトリ型検索エンジンの場合には、 WEBサイトのデータ入力及び分類を基本 的に人手で行って 、るため、ロボット型検索エンジンによるサービスと比較して情報 量が 2、 3桁少なぐ有名な WEBサイト以外を探すことが出来ないという問題がある。 また、 WEBサイトのデータ入力と分類を作業者の事務処理能力に頼っているため、 情報量を増大するのにも限界がある。  [0007] In the case of a directory-type search engine, data entry and classification of websites are basically performed manually, so the amount of information is two to three orders of magnitude less than services using robot-type search engines. There is a problem that it is impossible to search for anything other than famous websites. In addition, there is a limit to increasing the amount of information because the data input and classification of the website depend on the work processing ability of the workers.
[0008] また、ディレクトリ型エンジンの場合には、単に収集した WEBサイトの情報を分野別 に分類しているだけなので、ロボット型検索エンジンと同様に、異なるユーザが検索し た場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプ ロフィールゃ嗜好等を有するユーザの全てに対して満足のいく検索結果が得られる ことは少な 、と 、う問題がある。  [0008] Also, in the case of a directory-type engine, the collected website information is simply classified by field. Therefore, as with the robot-type search engine, even if different users search, the same keyword is used. As long as the search is performed, only the same search result is always obtained, and there is a problem that satisfactory search results are rarely obtained for all users having different profiles and preferences.
[0009] これに対して、ユーザの嗜好にあわせた検索結果を提供するシステムが提案されて いる(特許文献 1を参照。)このシステムでは、ユーザが情報を取り扱うために当該情 報を特定するための識別情報をユーザの操作に基づいてブックマーク登録するとと もに、ユーザの意図に基づいてカテゴリを付与して分類可能としている。さらに、各力 テゴリ内の情報のユーザ間での一致度を求めることにより、そのユーザと他のユーザ との嗜好の類似度を評価判定し、前記類似度が高 ヽと判定された他のユーザが評価 した情報を前記ユーザに紹介することができる。これによれば、ユーザは、嗜好が類 似した他のユーザが評価した情報をシステム力 紹介されるため、情報を探すための 時間及び費用が節約できる。  [0009] On the other hand, a system that provides a search result that matches the user's preference has been proposed (see Patent Document 1). In this system, the user specifies the information to handle the information. In addition to registering bookmarks for identification information based on user operations, categories can be assigned and classified based on user intentions. Furthermore, by determining the degree of coincidence between users of the information in each power category, the similarity of preference between the user and other users is evaluated and determined, and the other users whose similarity is determined to be high Can be introduced to the user. According to this, since the system power is introduced to the information evaluated by other users with similar preferences, the user can save time and cost for searching for information.
特許文献 1:特願 2000-187666号公報  Patent Document 1: Japanese Patent Application No. 2000-187666
発明の開示  Disclosure of the invention
発明が解決しょうとする課題  Problems to be solved by the invention
[0010] し力しながら、従来のシステムではユーザの嗜好の類似度に基づいて、提供を受け るユーザに未知の情報を提供することはできた力 キーワード検索時において、嗜好 の共通するユーザの動向(例えば、共通の趣味を有するユーザがどのページを数多 く参照しているか等)や、当該ページの直近の動向(例えば、直近に更新されたかど うか、あるいは、最近特に人気を集めているか等)を指標として、提供する情報を選別 することはできない。 However, in the conventional system, the provision is received based on the similarity of the user's preference. The ability to provide unknown information to users who are searching for keywords When searching for keywords, trends in users with common preferences (for example, which pages a user with a common hobby refers to) It is not possible to select the information to be provided by using the latest trend of the page (for example, whether it has been recently updated or has been particularly popular recently) as an index.
[0011] 本発明はこのような問題点に鑑みてなされたものであり、キーワード検索時における 検索結果をユーザにとってより価値のあるものとすることを目的とする。  The present invention has been made in view of such problems, and an object thereof is to make a search result at the time of keyword search more valuable to a user.
課題を解決するための手段  Means for solving the problem
[0012] 以上の課題を解決するための本発明は、クライアント端末力 入力された検索情報 に基づ!/、てインターネット上の Webページの情報を検索し、検索結果を前記クライァ ント端末に送信する情報検索装置であって、 Webページに関する登録情報を格納 する登録情報格納手段と、前記クライアント端末から前記検索情報を受信する受信 手段と、前記検索情報に含まれるキーワードに関連する Webページを検索用情報か ら検索し、第 1の検索結果を生成する第 1の検索結果生成手段と、前記登録情報格 納手段に格納された、前記第 1の検索結果に含まれる Webページに関する登録情 報から、前記検索情報に含まれる前記登録情報の利用の有無に関する設定情報を 利用して第 1の登録情報を選択する選択手段と、前記第 1の登録情報に基づいて、 前記第 1の検索結果に含まれる Webページの重み付け値を、該 Webページ毎に算 出する算出手段と、 Webページ毎に算出された前記重み付け値に基づき、前記第 1 の検索結果に含まれる Webページの順位を決定する順位決定手段と、決定された 前記順位により前記第 1の検索結果に含まれる Webページをソートして第 2の検索結 果を生成する第 2の検索結果生成手段と、前記第 2の検索結果を前記クライアント端 末に送信する送信手段とを備える。  [0012] The present invention for solving the above-described problems is based on the search information input by the client terminal! Searches for information on Web pages on the Internet and transmits the search result to the client terminal. An information search apparatus for storing registration information storage means for storing registration information relating to a Web page, receiving means for receiving the search information from the client terminal, and searching for a Web page related to a keyword included in the search information First search result generating means for searching for information and generating a first search result, and registration information relating to the Web page included in the first search result stored in the registered information storage means From the selection means for selecting the first registration information using setting information relating to the presence / absence of use of the registration information included in the search information, and based on the first registration information, Calculation means for calculating the weight value of the Web page included in the first search result for each Web page, and the Web page included in the first search result based on the weight value calculated for each Web page. Rank determining means for determining the rank of the page, second search result generating means for sorting the web pages included in the first search result according to the determined rank and generating a second search result; Transmitting means for transmitting the second search result to the client terminal.
発明の効果  The invention's effect
[0013] 以上のように、本発明によれば、キーワード検索時における検索結果をユーザにと つてより価値のあるものとすることができる。本発明のその他の特徴及び利点は、添 付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面におい ては、同じ若しくは同様の構成には、同じ参照番号を付す。 図面の簡単な説明 As described above, according to the present invention, it is possible to make the search result at the time of keyword search more valuable to the user. Other features and advantages of the present invention will become apparent from the following description with reference to the accompanying drawings. In the accompanying drawings, the same or similar components are denoted by the same reference numerals. Brief Description of Drawings
添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、そ の記述と共に本発明の原理を説明するために用いられる。  The accompanying drawings are included in the specification, constitute a part thereof, show an embodiment of the present invention, and are used to explain the principle of the present invention together with the description.
[図 1]本発明の実施形態に対応するシステムの全体構成の一例に対応する図である  FIG. 1 is a diagram corresponding to an example of the overall configuration of a system corresponding to an embodiment of the present invention.
[図 2]本発明の実施形態に対応するクライアント 101の構成の一例に対応する図であ る。 FIG. 2 is a diagram corresponding to an example of a configuration of a client 101 corresponding to the embodiment of the present invention.
[図 3]本発明の実施形態に対応するサーバ 103の構成の一例に対応する図である。  FIG. 3 is a diagram corresponding to an example of a configuration of a server 103 corresponding to the embodiment of the present invention.
[図 4A]本発明の実施形態に対応するユーザデータベース 104の登録内容の一例を 示す図である。 FIG. 4A is a diagram showing an example of registration contents of a user database 104 corresponding to the embodiment of the present invention.
[図 4B]本発明の実施形態に対応するブックマークデータベース 105の登録内容の一 例を示す図である。  FIG. 4B is a diagram showing an example of registered contents in the bookmark database 105 corresponding to the embodiment of the present invention.
[図 4C]本発明の実施形態に対応する URLデータベース 106の登録内容の一例を 示す図である。  FIG. 4C is a diagram showing an example of registered contents in the URL database 106 corresponding to the embodiment of the present invention.
[図 4D]本発明の実施形態に対応する URLデータベース 106の登録内容の他の一 例を示す図である。  FIG. 4D is a diagram showing another example of registered contents in the URL database 106 corresponding to the embodiment of the present invention.
[図 5]本発明の実施形態に対応する、オンラインブックマークが利用される際のクライ アント 101 ·サーバ 103間における処理の一例に対応するフローチャートである。  FIG. 5 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when an online bookmark is used, corresponding to the embodiment of the present invention.
[図 6A]本発明の実施形態に対応するクライアント 101のディスプレイ 207に表示され る表示画面の一例を示す図である。 FIG. 6A is a diagram showing an example of a display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
[図 6B]本発明の実施形態に対応するクライアント 101のディスプレイ 207に表示され る表示画面の他の一例を示す図である。  FIG. 6B is a diagram showing another example of a display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
[図 6C]本発明の実施形態に対応するクライアント 101のディスプレイ 207に表示され る表示画面の更に他の一例を示す図である。  FIG. 6C is a diagram showing still another example of the display screen displayed on the display 207 of the client 101 corresponding to the embodiment of the present invention.
[図 7]本発明の実施形態に対応する検索処理が実行される際の、クライアント 101 ·サ ーバ 103間における処理の一例に対応するフローチャートである。  FIG. 7 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when search processing corresponding to the embodiment of the present invention is executed.
[図 8]本発明の実施形態に対応する、サーバ 103における検索処理の一例に対応す るフローチャートである。 発明を実施するための最良の形態 FIG. 8 is a flowchart corresponding to an example of search processing in the server 103, corresponding to the embodiment of the present invention. BEST MODE FOR CARRYING OUT THE INVENTION
[0015] 以下に、添付する図面を参照して本発明の実施形態を説明する。ただし、この実施 の形態に記載されている構成要素はあくまでも例示であり、この発明の範囲をそれら のみに限定する趣旨のものではない。  Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. However, the constituent elements described in this embodiment are merely examples, and are not intended to limit the scope of the present invention.
[0016] <システム構成 >  [0016] <System configuration>
図 1は、本実施形態に対応する検索システムの全体構成を示すブロック図である。 ユーザが操作してコンテンツの閲覧を行うクライアント 101a、 101b, 101c (以下、こ れらを総称して「クライアント 101」という。)、検索を行うサーバ 103、コンテンツを公開 するコンテンツサーバ 108が、それぞれインターネット 102に接続されている。また、 サーバ 103には、ユーザデータベース 104、ブックマークデータベース 105、 URLデ ータベース 106、検索用データベース 107が接続されて!、る。  FIG. 1 is a block diagram showing the overall configuration of a search system corresponding to this embodiment. Clients 101a, 101b, and 101c (hereinafter collectively referred to as “client 101”) that are operated by a user to browse content, a server 103 that performs search, and a content server 108 that publishes content, respectively. Connected to Internet 102. In addition, a user database 104, a bookmark database 105, a URL database 106, and a search database 107 are connected to the server 103 !.
[0017] クライアント 101は、ユーザが操作して、インターネット上に公開されたコンテンツを 閲覧可能なクライアント端末としての情報処理装置であり、ノートパソコン、デスクトツ プパソコン、携帯情報端末、携帯電話等を含む。クライアント 101には、所定のベー ジ記述言語 (例えば、 HTML, XML、 PDF或いは PS等)で記載されたコンテンツを 表示画面上に表示可能なソフトウェアがインストールされて 、るものとする。以下の本 実施形態では、簡単のために、当該ソフトウェアとして、所謂インターネット 'ブラウザ 力 Sインストールされて 、る場合を例として説明する。  [0017] The client 101 is an information processing apparatus as a client terminal that can be operated by a user and browse content published on the Internet, and includes a notebook computer, a desktop computer, a portable information terminal, a cellular phone, and the like. . It is assumed that the client 101 is installed with software capable of displaying content described in a predetermined page description language (for example, HTML, XML, PDF, PS, etc.) on the display screen. In the following embodiment, for the sake of simplicity, a case where the so-called Internet browser power S is installed as the software will be described as an example.
[0018] クライアント 101は、イーサネット(登録商標)等のネットワークケーブルを含むァクセ ス手段である LANによってインターネット 102に接続されている。尚、ネットワーク 10 2へのアクセス手段はイーサネット(登録商標)ケーブルに限定されるものではなぐ 例えば、 RS232Cインタフェースに準じた通信ケーブルや、無線 LAN等の無線通信 手段によって構成されていてもよい。後述するサーバ 103、コンテンツサーバ 108も 同様のアクセス手段を備えて 、るものとする。  [0018] The client 101 is connected to the Internet 102 via a LAN that is an access means including a network cable such as Ethernet (registered trademark). The access means to the network 102 is not limited to an Ethernet (registered trademark) cable. For example, the access means may be constituted by a communication cable conforming to the RS232C interface or a wireless communication means such as a wireless LAN. The server 103 and the content server 108 described later are also provided with similar access means.
[0019] インターネット 102は、世界中のネットワークが互いに接続されたネットワークである 力 例えば、イントラネットのように特定の糸且織内においてのみ接続可能なネットヮー クであってもよい。  [0019] The Internet 102 is a network in which networks all over the world are connected to each other. For example, the Internet 102 may be a network that can be connected only within a specific thread and fabric such as an intranet.
[0020] サーバ 103は、クライアント 101に検索サービスを提供する情報検索装置としての 情報処理装置であり、ユーザデータベース 104、ブックマークデータベース 105、 U RLデータベース 106、検索用データベース 107に格納されている情報を管理してい る。サーバ 103は、インターネット 102上で閲覧可能な Webサイトに定期的にアクセス して、そこに含まれる URL、タイトル、全文データを収集し、 URLデータベース 106 や検索用データベース 107を更新する。 [0020] The server 103 serves as an information search device that provides a search service to the client 101. The information processing apparatus manages information stored in the user database 104, bookmark database 105, URL database 106, and search database 107. The server 103 periodically accesses a Web site that can be browsed on the Internet 102, collects the URL, title, and full-text data included therein, and updates the URL database 106 and the search database 107.
[0021] また、ブックマークデーベース 105の更新を監視し、ユーザブックマークに新たな U RLが追加されたり、削除されたりした場合には、対応する URLデータベース 106〖こ 登録されている情報の更新を行う。また、クライアント 101における、ブックマークに登 録された URLの選択動作を監視し、各ユーザの参照回数を記録している。サーバ 1 03は、例えば、 LANによって、ユーザデータベース 104、ブックマークデータベース 105、 URLデータベース 106、検索用データベース 107に接続されている。  [0021] The update of the bookmark database 105 is monitored, and when a new URL is added to or deleted from the user bookmark, the corresponding URL database 106 is updated. Do. In addition, the selection operation of the URL registered in the bookmark in the client 101 is monitored, and the reference count of each user is recorded. The server 103 is connected to the user database 104, the bookmark database 105, the URL database 106, and the search database 107 by, for example, LAN.
[0022] ユーザデータベース 104、ブックマークデータベース 105、 URLデータベース 106 、検索用データベース 107は、それぞれ所定のデータベース 'ソフトウェアがインスト ールされた情報処理装置であり、各種データの管理を行う。ユーザデータベース 10 4は、ユーザデータの情報を管理する。ブックマークデータベース 105は、各ユーザ のブックマークデータを管理する。 URLデータベース 106は、各ユーザがブックマー クに登録しているページに関する登録情報を統一的に管理する。検索用データべ一 ス 107は、検索処理用の情報を管理する。  [0022] The user database 104, the bookmark database 105, the URL database 106, and the search database 107 are information processing apparatuses in which predetermined database software is installed, and manage various data. The user database 104 manages information on user data. The bookmark database 105 manages bookmark data for each user. The URL database 106 uniformly manages registration information related to pages registered by each user in the bookmark. The search database 107 manages information for search processing.
[0023] コンテンツサーバ 108は、ウェブページ等のコンテンツを提供する情報処理装置で あり、例えば、ウェブサーバ等のソフトウェアがインストールされている。  The content server 108 is an information processing apparatus that provides content such as a web page, and for example, software such as a web server is installed.
[0024] 尚、本明細書では、便宜上、サーバ 103、ユーザデータベース 104、ブックマーク データベース 105、 URLデータベース 106、及び、検索用データベース 107は、そ れぞれ物理的に独立した情報処理装置によって実現されるものとして説明するが、 本発明の実施形態はこれに限られるものではない。例えば、これらが単一の情報処 理装置によって実現されてもよい。また、ユーザデータベース 104、ブックマークデー タベース 105、 URLデータベース 106及び検索用データベース 107は、サーバ 103 と LAN等によって接続されているものとして説明する力 例えば、インターネット 102 や非図示のイントラネット経由でサーバ 103と通信可能な形態をとつてもよい。 [0025] <情報処理装置の構成 > In this specification, for the sake of convenience, the server 103, the user database 104, the bookmark database 105, the URL database 106, and the search database 107 are each realized by a physically independent information processing device. However, the embodiment of the present invention is not limited to this. For example, these may be realized by a single information processing device. Further, the user database 104, the bookmark database 105, the URL database 106, and the search database 107 can be described as being connected to the server 103 via a LAN or the like. You may take the form which can communicate. <Configuration of information processing apparatus>
次に、本実施形態に対応する検索システムを構成する情報処理装置の概略につ いて説明する。図 2は、クライアント 101のハードウェア構成の一例を示すブロック図 である。上述した情報処理装置としてのユーザデータベース 104、ブックマークデー タベース 105、 URLデータベース 106及び検索用データベース 107も、同様或いは 同等のハードウェア構成として構成しても良 、。  Next, an outline of the information processing apparatus constituting the search system corresponding to the present embodiment will be described. FIG. 2 is a block diagram illustrating an example of the hardware configuration of the client 101. The user database 104, the bookmark database 105, the URL database 106, and the search database 107 as the information processing apparatus described above may be configured with the same or equivalent hardware configuration.
[0026] 図 2において、 200は CPUであり、ハードディスク装置(以下、 HDと呼ぶ) 205に格 納されて 、るアプリケーションプログラム、オペレーティングシステム(OS)や制御プロ グラム等を実行し、 RAM202にプログラムの実行に必要な情報、ファイル等を一時 的に格納する制御を行う。  In FIG. 2, reference numeral 200 denotes a CPU, which is stored in a hard disk device (hereinafter referred to as HD) 205 and executes an application program, an operating system (OS), a control program, etc. Control to temporarily store information, files, etc. necessary for execution.
[0027] 201は ROMであり、内部には基本 I/Oプログラム等のプログラム、文書処理の際 に使用するフォントデータ、テンプレート用データ等の各種データを記憶する。 202 は各種データを一時記憶するための RAMであり、 CPU200の主メモリ、ワークエリア 等として機能する。  Reference numeral 201 denotes a ROM that stores therein various data such as a program such as a basic I / O program, font data used for document processing, and template data. 202 is a RAM for temporarily storing various data, and functions as the main memory, work area, etc. of the CPU 200.
[0028] 203は記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア( 記録媒体) 204に記憶されたプログラム等を本コンピュータシステムにロードすること 力 sできる。尚、メディア 204は、例えば、フレキシブルディスク(FD)、 CD— ROM、 CD R、 CD-RW, PCカード、 DVD, ICメモリカード、 MO、メモリスティック等を利用す ることがでさる。 [0028] 203 is an external storage drive for realizing the access to the recording medium, it can be force s load media (recording medium) 204 a program stored in such in the computer system. As the media 204, for example, a flexible disk (FD), CD-ROM, CDR, CD-RW, PC card, DVD, IC memory card, MO, memory stick, etc. can be used.
[0029] 205は外部記憶装置であり、本実施形態では大容量メモリとして機能する HDを用 いている。 HD205には、アプリケーションプログラム、 OS、制御プログラム、関連プロ グラム等が格納される。  [0029] Reference numeral 205 denotes an external storage device, which uses an HD functioning as a large-capacity memory in this embodiment. The HD 205 stores application programs, OS, control programs, related programs, and the like.
[0030] 206は指示入力装置であり、キーボードやポインティングデバイス(マウス等)、タツ チパネル等がこれに相当する。指示入力装置 206を用いて、ユーザは、クライアント 1 01に対して、装置を制御するコマンド等を入力指示する。  Reference numeral 206 denotes an instruction input device, which corresponds to a keyboard, a pointing device (such as a mouse), and a touch panel. Using the instruction input device 206, the user instructs the client 101 to input a command or the like for controlling the device.
[0031] 207はディスプレイであり、指示入力装置 206から入力したコマンドや、それに対す るクライアント 101の応答出力等を表示したりするものである。  [0031] Reference numeral 207 denotes a display which displays a command input from the instruction input device 206, a response output of the client 101 in response thereto, and the like.
[0032] 209はシステムバスであり、情報処理装置内のデータの流れを司るものである。 20 8はインターフェイス(以下、 IZFという)であり、この IZF208を介して外部装置との データのやり取りを行う。 [0032] Reference numeral 209 denotes a system bus, which controls the flow of data in the information processing apparatus. 20 8 is an interface (hereinafter referred to as IZF), and exchanges data with external devices via this IZF208.
[0033] 尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の 代替として構成することもできる。  [0033] It should be noted that software that realizes functions equivalent to those of each of the above devices can be configured as an alternative to a hardware device.
[0034] 本実施形態では、メディア 204から本実施形態に係るプログラム及び関連データを 直接 RAM202にロードして実行させる例を示す力 これ以外にも、本実施形態に係 るプログラムを動作させる度に、既にプログラムがインストールされている HD205から RAM202にロードするようにしてもよい。また、本実施形態に係るプログラムを ROM 201に記録しておき、これをメモリマップの一部をなすように構成し、直接 CPU200 で実行することも可能である。  [0034] In the present embodiment, a power indicating an example in which the program and related data according to the present embodiment are directly loaded into the RAM 202 from the medium 204 and executed, in addition to this, every time the program according to the present embodiment is operated. Alternatively, the program may be loaded into the RAM 202 from the HD 205 in which the program is already installed. It is also possible to record the program according to the present embodiment in the ROM 201, configure it as a part of the memory map, and execute it directly by the CPU 200.
[0035] 図 3は、サーバ 103の機器構成を示すブロック図である。 CPU300、 ROM301、 R AM302、外部記憶ドライブ 303、メディア 304、 HD305、指示入力装置 306、ディ スプレイ 307、 I/F308,システムバス 309の機能及び用途、更には、これらの関係 は、図 2を用いて説明したものと同様或いは同等である。図 3では、データベース 310 がシステムバス 309に接続されていることに留意する。ここで、データベース 310は、 ユーザデータベース 104、ブックマークデータベース 105、 URLデータベース 106 及び検索用データベース 107を総称するものである。  FIG. 3 is a block diagram showing a device configuration of the server 103. Functions and applications of CPU300, ROM301, RAM302, external storage drive 303, media 304, HD305, instruction input device 306, display 307, I / F308, system bus 309, and their relationship are shown in Fig. 2. Are the same as or equivalent to those described above. Note that in FIG. 3, database 310 is connected to system bus 309. Here, the database 310 is a generic term for the user database 104, the bookmark database 105, the URL database 106, and the search database 107.
[0036] <ユーザデータの構造 >  [0036] <User data structure>
図 4Aは、ユーザデータベース 104に格納されているユーザデータの構造の一例を 説明する図である。ユーザデータは、個々のユーザの特徴や属性に関する種々の情 報によって構成される。  FIG. 4A is a diagram for explaining an example of the structure of user data stored in the user database 104. User data is composed of various information related to the characteristics and attributes of individual users.
[0037] 図 4Aにおいて、 401はユーザ IDであり、各ユーザを一意に識別するためにュニー クに与えられた識別子である。 402はパスワードであり、各ユーザが登録された個人 情報にアクセスしたり、ブックマークを利用する際の認証に利用される。 403はユーザ 名、 404はユーザのメールアドレス、 405は年齢、 406は性別、 407は、ユーザが活 動又は居住する地域属性、 408は職種、 409は未既婚、 410は住居形態、 411は年 収、 412は自家用車の所有、 413は趣味である。それぞれのデータは予めユーザか ら提供されて、ユーザデータとして登録される。また、上記の内容はユーザデータの 一例として上げたものであって、これら全てが登録されている必要はないし、また、こ れら以外にもユーザを特徴づける情報を登録しても良い。 [0037] In FIG. 4A, 401 is a user ID, which is an identifier given to the unique to uniquely identify each user. Reference numeral 402 denotes a password, which is used for authentication when each user accesses registered personal information or uses a bookmark. 403 is the user name, 404 is the user's e-mail address, 405 is the age, 406 is the gender, 407 is the region where the user is active or resides, 408 is the occupation, 409 is unmarried, 410 is the residence type, 411 is the year 412 is private car ownership and 413 is a hobby. Each data is provided in advance by the user and registered as user data. Also, the above content is the user data It is given as an example, and it is not necessary that all of these are registered, and other information that characterizes the user may be registered.
[0038] <ブックマークの構成 >  [0038] <Bookmark configuration>
本実施形態においてブックマークはユーザにより作成'更新される力 ブックマーク データはすべてサーバ 103に接続されたブックマークデータベース 105に各ユーザ 毎に格納されており、ユーザがクライアント 101においてウェブブラウザを起動した際 に、クライアント 101にダウンロードされて、ウェブブラウザ上に表示される。  In this embodiment, the bookmark is created and updated by the user. All bookmark data is stored in the bookmark database 105 connected to the server 103 for each user, and when the user starts the web browser on the client 101, It is downloaded to the client 101 and displayed on the web browser.
[0039] ブックマークは、公知のディレクトリ構造において、 URL及び当該 URLを特定のま とまりとして格納するフォルダにより構成される。即ち、各 URLはユーザごとのディレク トリツリー(以下、ブックマークディレクトリという)の中に登録され、ブックマークディレク トリの直下であっても、任意に作成されたフォルダ内にあってもよい。  [0039] A bookmark is composed of a URL and a folder for storing the URL as a specific group in a known directory structure. That is, each URL is registered in a directory tree for each user (hereinafter referred to as a bookmark directory), and may be directly under the bookmark directory or in an arbitrarily created folder.
[0040] 図 4Bは、ブックマーク内に登録されたページに関する情報の管理の一例を示す図 である。図 4Bにおいて、ユーザ IDは当該ブックマークを利用するユーザの識別子で あり、図 4Aにおけるユーザ ID401と対応する。これによりユーザとブックマークとの対 応をとることができる。 422には、登録対象となる Webページを識別するための情報 が登録される。本実施形態では URLデータベース 106を利用して、各ページに関す る情報を統一的に管理しているので、ユーザの個々のブックマークには対応するぺ ージの URLは格納されない。その代わりに、 URLデータベース 106において当該べ ージを管理するための識別番号 (URL— ID)が格納される。なお、 URLデータべ一 ス 106を利用しない場合には、 URLそのものを登録しても良い。  FIG. 4B is a diagram showing an example of management of information related to pages registered in bookmarks. In FIG. 4B, the user ID is an identifier of the user who uses the bookmark, and corresponds to the user ID 401 in FIG. 4A. As a result, the user can be associated with the bookmark. In 422, information for identifying a Web page to be registered is registered. In this embodiment, the URL database 106 is used to manage information about each page in a unified manner, so the URL of the corresponding page is not stored in each user bookmark. Instead, an identification number (URL—ID) for managing the page is stored in the URL database 106. If the URL database 106 is not used, the URL itself may be registered.
[0041] 423は各ページに与えられたブックマーク名である。このブックマーク名 423は、ュ 一ザがブックマーク登録する際に、任意に設定した名称であっても良いし、当該べ一 ジに本来割り当てられている名称であっても良い。 424は、当該ページが作成された 日時 (ネットワーク 102上で初めて公開された日時に相当する。 )を示す。 425は、当 該ページが最新に更新された日時を示す。 426は、ユーザが最新に当該ページを 参照した日時を示す。 427は、ユーザによる当該ページの総参照回数を示す。総参 照回数とは、ユーザがこれまでに当該ページを参照した回数の総計をいう。 428は、 ユーザによる当該ページの直近の参照回数を示す。ここで、直近の参照回数とは、 直近の所定期間(例えば、 1週間、 1ヶ月など)において当該ページがユーザにより参 照された回数の合計をいう。 [0041] Reference numeral 423 denotes a bookmark name given to each page. The bookmark name 423 may be a name arbitrarily set when the user registers a bookmark, or may be a name originally assigned to the page. Reference numeral 424 indicates the date and time when the page was created (corresponding to the date and time when the page was first published on the network 102). 425 indicates the date and time when the page was updated. 426 indicates the date and time when the user referred to the page most recently. Reference numeral 427 denotes the total number of times the user refers to the page. The total number of references refers to the total number of times the user has referred to the page so far. Reference numeral 428 indicates the number of times the user has referred to the page recently. Here, the most recent reference count is This is the total number of times the page was viewed by the user during the most recent predetermined period (eg, 1 week, 1 month, etc.).
[0042] なお、ブックマークに登録された各ページ間の関係や、当該ページを格納するフォ ルダに関する情報は、図 4Bに示すテーブルとは別に、ブックマークデータベース 10 5内にディレクトリテーブルが用意され、そこに格納される。  [0042] In addition to the table shown in Fig. 4B, a directory table is prepared in the bookmark database 105 for the relationship between the pages registered in the bookmark and information on the folder storing the page. Stored in
[0043] ここで、サーバ 103は、上述の通りブックマーク登録されている各ページの更新を 定期的に監視しており、更新があった場合には 425の更新日時の内容を更新する。  Here, the server 103 periodically monitors the update of each page registered as a bookmark as described above, and updates the contents of the update date and time of 425 when there is an update.
[0044] <URLデータベースの構成 >  [0044] <URL database configuration>
URLデータベース 106は、ブックマークデータベース 105に登録されて!、る URL— ID422に対応するページに関する情報を登録している。図 4Cは、 URLデータべ一 ス 106におけるページに関する情報の管理の一例を示す図である。  The URL database 106 registers information related to the page corresponding to the URL—ID 422 registered in the bookmark database 105! FIG. 4C is a diagram illustrating an example of management of information regarding pages in the URL database 106.
[0045] 図 4Cにおいて、 422は、 URLに与えられた ID (識別子)を表しており、図 4Bにお ける URL— ID422と対応する。 429は、 URL— ID422が与えられた URLを示す。 43 0は、 URLに対応する Webコンテンツが本来有するタイトルを示す。作成日時、更新 日時は図 4Bと同様である。 431は、最終参照日時を示し、複数のブックマークユー ザのいずれかが最新に、当該ページを参照した日時を示す。 432は、複数のユーザ の総参照回数 427の合計、即ち、複数のユーザにより当該ページが参照された回数 の総計を表す。  In FIG. 4C, 422 represents an ID (identifier) given to the URL, and corresponds to the URL—ID 422 in FIG. 4B. Reference numeral 429 denotes a URL to which a URL—ID422 is given. 43 0 indicates the title inherent in the Web content corresponding to the URL. The creation date and update date are the same as in Figure 4B. 431 indicates the last reference date and time, and indicates the date and time when one of the bookmark users referred to the page most recently. Reference numeral 432 represents the total of the total number of times 427 of the plurality of users, that is, the total number of times the page is referred to by the plurality of users.
[0046] 直近参照回数 433は、複数のユーザの直近参照回数 428の合計、即ち、直近の所 定期間内に複数のユーザにより当該ページが参照された回数の合計を表す。従って 、「直近の所定期間」については、図 4Bの場合と同様である。例えば、最近立ち上げ られたば力りであるが人気のあるページは、この直近参照回数 433が高くなるので、 ページ毎に直近の人気の度合いを判定することが可能となる。 434は、増加アンカー 数であって、当該ページについて直近の所定期間内に追加されたアンカー数を示 す。本実施形態においてアンカーとは、ページ内に埋め込まれた、他のページへの リンク情報を言う。また、「直近の所定期間」については上記と同様である。また、 435 は、ブックマーク登録数であって、当該ページをブックマークに登録しているユーザ 数を示す。 [0047] また、 URLデータベース 106は、ページをブックマークに登録しているユーザのュ 一ザデータ毎の参照回数や、ブックマーク登録数を管理している。図 4Dは、 URLデ ータベース 106におけるページに関する情報の管理の他の一例を示す図である。 The most recent reference count 433 represents the total of the recent reference counts 428 of a plurality of users, that is, the total number of times that the page has been referred to by a plurality of users within the most recent predetermined period. Therefore, the “predetermined predetermined period” is the same as in FIG. 4B. For example, recently popular pages that are popular, but popular, have a higher recent reference count of 433, so it is possible to determine the most recent degree of popularity for each page. 434 is the number of increased anchors, and indicates the number of anchors added within the most recent predetermined period for the page. In the present embodiment, an anchor refers to link information to another page embedded in a page. Further, “the most recent predetermined period” is the same as described above. Also, 435 is the number of bookmarks registered, and indicates the number of users who have registered the page in bookmarks. [0047] Further, the URL database 106 manages the reference count and the bookmark registration count for each user data of a user who has registered a page as a bookmark. FIG. 4D is a diagram illustrating another example of management of information related to pages in the URL database 106.
[0048] 図 4Dでは、各ページ毎に、ユーザデータの詳細に対応する総参照回数、直近参 照回数及びブックマーク登録数を登録している。 422は、各ページに割り当てられた URL— IDを示す。 440は、ユーザデータであり、図 4Aに示した個々のユーザデータ が登録される。 441は総参照回数であり、ユーザデータ毎に集計された当該ページ に対する参照回数の総計が登録される。 442は、直近参照回数であって、ユーザデ ータ毎に集計された当該 URLに対する直近の所定期間における参照回数の合計が 登録される。「直近の所定期間」については、上記と同様である。また、 443は、ブック マーク登録数であり、当該ページをブックマークに登録して!/ヽるユーザ数をユーザデ ータ毎に合計した値が登録される。  [0048] In FIG. 4D, the total reference count, the latest reference count, and the bookmark registration count corresponding to the details of the user data are registered for each page. Reference numeral 422 denotes a URL ID assigned to each page. Reference numeral 440 denotes user data, in which individual user data shown in FIG. 4A is registered. Reference numeral 441 denotes the total number of times of reference, and the total number of times of reference with respect to the page, which is aggregated for each user data, is registered. Reference numeral 442 denotes the number of the latest references, and the total of the number of references for the most recent predetermined period with respect to the URL, which is aggregated for each user data, is registered. The “predetermined predetermined period” is the same as described above. Also, 443 is the number of bookmarks registered, and a value obtained by adding the number of users who register the page as a bookmark to! / Speak for each user data is registered.
[0049] 図 4Dで ίま、ユーザデータ 440につ!/ヽて、年齢 405、趣味 413、職種 408力 ^登録 f列 を記載している力 年齢 405を参酌すると、「10代」、「20代」等のように一定の年齢 層毎に総参照回数 441、直近参照回数 442、及び、ブックマーク登録数 443が登録 されている。つまり、 10代のユーザが当該 URLを参照した合計は 100回であり、 20 代のユーザが当該 URLを参照した合計は 300回であること力 図 4D力も読みとれる  [0049] In Fig. 4D, the user data 440 is reached! /, Age 405, hobby 413, job type 408 power ^ power that describes the registered f column When age 405 is considered, "10s", " The total number of referrals 441, the latest reference count 442, and the number of bookmark registrations 443 are registered for each age group, such as “20's”. In other words, the total number of users in their teens who referred to the URL is 100 times, and the total number of users in their 20s who referred to the URL is 300 times.
[0050] また、直近の参照回数については、 10代が 30回であり、 20代が 20回であることが 読みとれる。即ち、この URLに対応する Webコンテンツには、全体的には 20代のュ 一ザが、 10代のユーザよりも関心を強く示している一方、直近だけを見た場合には 1 0代のユーザの関心が強くなつていることが分かる。また、ブックマーク登録数 443を 参照すれば、 10代力 40代などにおいて、どの年齢層がどれだけブックマーク登録 して 、るかを把握することができる。 [0050] Regarding the most recent reference count, it can be seen that the teenager is 30 times and the 20s is 20 times. In other words, users in their 20s are generally more interested in the Web content corresponding to this URL than users in their 10s, but if they look only at the latest, they are in their 10s. It can be seen that the user's interest is growing. In addition, by referring to the number of bookmarks registered 443, it is possible to grasp which age group and how many bookmarks are registered in the age of 40s and 40s.
[0051] 図 4Aに示したとおり、ユーザデータ 440には「年齢」、「趣味」、「職種」以外にも複 数含まれており、これらのユーザデータそれぞれについて、総参照回数 441、直近 参照回数 442及びブックマーク登録数 443が登録されている。このようなユーザデー タ毎の総参照回数 441、直近参照回数 442及びブックマーク登録数 443のデータは 、図 4A及び図 4Bに示したデータを利用すれば得られる。 [0051] As shown in FIG. 4A, the user data 440 includes a plurality of items other than "age", "hobby", and "job type". For each of these user data, the total number of reference times 441, the latest reference 442 times and 443 bookmarks are registered. The total number of reference times 441, the number of latest reference times 442, and the number of bookmark registrations 443 are as follows: It can be obtained by using the data shown in FIGS. 4A and 4B.
[0052] なお、本実施形態では、図 4Aから図 4Dまでに例示したデータベースの個々の登 録内容のことを登録情報と称する。  In the present embodiment, the individual registered contents of the database illustrated in FIGS. 4A to 4D are referred to as registration information.
[0053] <検索用データベースの構成 >  [0053] <Search database configuration>
検索用データベース 107は、ユーザ力も提供されるキーワードに関連する Webぺ ージを検索するための検索用情報として検索処理用の情報を管理するものであり、ィ ンターネット 102上の Webサイトから収集された検索データが登録される。検索デー タは、主として各検索データの識別子、キーワード、属性、データ取得時間、データ 取得 URL、 URLのタイトル、全文データ (Description)等から構成される力 この他の データを含めてもよい。  The search database 107 manages information for search processing as search information for searching Web pages related to keywords for which user power is also provided, and is collected from the Web site on the Internet 102. The retrieved search data is registered. The search data may include other data that mainly consists of the identifier, keyword, attribute, data acquisition time, data acquisition URL, URL title, full text data (Description), etc. of each search data.
[0054] <オンラインブックマーク >  [0054] <Online bookmark>
図 5は、クライアント 101においてオンラインブックマークが利用される際の、クライア ント 101 ·サーバ 103間における処理の一例に対応するフローチャートである。まず、 クライアント 101にお!/、て Webブラウザが起動されると(ステップ S551にお!/、て「YE S」)、ブックマークデータ要求がユーザ ID401と共にサーバ 103に通知され(501)、 サーバ 103では、通知されたユーザ ID401に基づいて、ブックマークデータベース 1 05を検索し、当該ユーザのブックマークデータを選択する(ステップ S552)。選択さ れたブックマークデータはサーバ 103からクライアント 101に対して送信される(502)  FIG. 5 is a flowchart corresponding to an example of processing between the client 101 and the server 103 when an online bookmark is used in the client 101. First, when the web browser is started up by the client 101 (! /! At step S551!), The bookmark data request is notified to the server 103 together with the user ID 401 (501). Then, the bookmark database 105 is searched based on the notified user ID 401, and the bookmark data of the user is selected (step S552). The selected bookmark data is transmitted from the server 103 to the client 101 (502).
[0055] クライアント 101では、起動された Webブラウザをディスプレイ 207上に表示し、 We bブラウザのブックマーク表示領域にサーバ 103から送信されたブックマークデータ に基づくブックマーク情報を表示する (ステップ S553)。 [0055] The client 101 displays the activated web browser on the display 207, and displays bookmark information based on the bookmark data transmitted from the server 103 in the bookmark display area of the web browser (step S553).
[0056] その後、クライアント 101ではユーザ力ものブックマークに対する操作を受け付けた 力どうかを監視し、もし操作を受け付けた場合には (ステップ S554で「YES」)、サー ノ 103に対してブックマーク操作内容を通知する(503)。ここで、ユーザ力 受け付 けるブックマークの操作には、例えば、ブックマークに登録されている URLの選択、 新たな URLの追加、登録済みの URLの情報の編集(削除を含む)等がある。  [0056] After that, the client 101 monitors whether or not the user has received an operation on the bookmark, and if the operation is received (“YES” in step S554), the bookmark operation content is displayed to the server 103. Notification is made (503). Here, the operation of the bookmark that accepts user power includes, for example, selection of a URL registered in the bookmark, addition of a new URL, editing (including deletion) of registered URL information, and the like.
[0057] クライアント 101からブックマーク操作内容を受信すると、サーバ 103では、受信し た内容に基づいて各データベースを更新する。当該通知が、例えばユーザがある U RLを選択した通知であった場合には、対応する URLについての参照日時 426、総 参照回数 427、直近参照回数 428、最終参照日時 431、総参照回数 432、直近参 照回数 433、総参照回数 441、直近参照回数 442をそれぞれ更新する。 [0057] When the bookmark operation content is received from the client 101, the server 103 receives the bookmark operation content. Update each database based on the contents. If the notification is, for example, a notification that a user has selected a URL, the reference date and time 426 for the corresponding URL, the total reference count 427, the latest reference count 428, the last reference date and time 431, the total reference count 432, The latest reference count 433, the total reference count 441, and the latest reference count 442 are updated.
[0058] また、ユーザが Webブラウザの閲覧を終了する場合には、クライアント 101からサー ノ 103に対して終了通知が送信され(504)、サーバ 103からは終了応答が返される (505)。 [0058] When the user finishes browsing the Web browser, a termination notification is transmitted from the client 101 to the server 103 (504), and a termination response is returned from the server 103 (505).
[0059] 以上により、サーバ 103が管理するブックマークデータベース 105及び URLデータ ベース 106は、常にユーザ力 受け付けた操作に基づいて内容が更新されることとな る。  [0059] As described above, the contents of the bookmark database 105 and the URL database 106 managed by the server 103 are always updated based on the operation accepted by the user.
[0060] <検索処理その 1 (検索画面) >  [0060] <Search process 1 (Search screen)>
次に、本実施形態におけるサーバ 103を利用してクライアント 101が Webページの 検索処理を実行する場合の処理について具体的に説明する。  Next, processing when the client 101 executes Web page search processing using the server 103 in this embodiment will be specifically described.
[0061] 図 6A乃至図 6Cは、ユーザ力クライアント 101において検索処理を実行する場合に 、ディスプレイ 207に表示される画面の一例を示す図である。ユーザが検索処理を実 行しょうとする場合には、所定の URLを指定してサーバ 103が提供する検索ページ にアクセスする。この時最初にディスプレイ 207に表示される画面が、図 6A乃至図 6 Cに示すような画面 600である。画面 600は、検索画面 601とブックマーク表示領域 6 06とに大きく分割される。ブックマーク表示領域 606には、前述のサーバ 103から提 供されたブックマークデータに基づくブックマーク表示がなされており、ユーザはブッ クマークに登録されたページを選択して、閲覧することができる。  FIGS. 6A to 6C are diagrams showing examples of screens displayed on the display 207 when the user power client 101 executes search processing. When a user intends to execute a search process, a predetermined URL is specified and a search page provided by the server 103 is accessed. At this time, the screen first displayed on the display 207 is a screen 600 as shown in FIGS. 6A to 6C. The screen 600 is largely divided into a search screen 601 and a bookmark display area 600. In the bookmark display area 606, bookmark display based on the bookmark data provided from the server 103 is performed, and the user can select and browse a page registered in the bookmark.
[0062] 図 6Aに示すごとぐサーバ 103は「〇Χ Δサーチ」という名称で検索サービスを提 供しており、検索画面 601には、キーワード入力領域 602、検索実行ボタン 603、ォ プシヨン 604、及び設定ボタン 605が表示される。キーワード入力領域 602は、ユー ザが検索したいキーワードの入力を受け付ける領域である。検索実行ボタン 603は、 入力されたキーワードについて、設定されたオプションの内容に従った検索処理をサ ーバ 103に指示するためのボタンである。オプション 604では、図 6Cに示すような、 ページ情報や、ユーザデータに基づく検索結果のソーティングを行うかどうかの指示 をユーザ力も受け付ける。即ち、「利用する」が選択されると、オプションとして設定さ れた内容を利用した検索が行われる。一方、「利用しない」が選択されると、ォプショ ンとして設定された内容は利用せずに、通常の検索処理が実行され、この検索結果 力 Sクライアント 101に通知される。 [0062] As shown in FIG. 6A, the server 103 provides a search service with the name “O Δ search”. The search screen 601 includes a keyword input area 602, a search execution button 603, an option 604, and A setting button 605 is displayed. The keyword input area 602 is an area for receiving an input of a keyword that the user wants to search. The search execution button 603 is a button for instructing the server 103 to perform a search process according to the contents of the set option for the input keyword. Option 604 indicates whether to sort the search results based on page information or user data, as shown in Figure 6C. The user power is also accepted. In other words, when “use” is selected, a search using the content set as an option is performed. On the other hand, if “do not use” is selected, normal search processing is executed without using the content set as an option, and this search result output S client 101 is notified.
[0063] 図 6Aの場合では、「利用する」が選択されて 、るので、オプションの設定内容を利 用した検索が行われることとなる。また、「利用する」が選択された場合には、設定ボタ ン 605がアクティブになり、この設定ボタン 605の選択を受け付けると、図 6Bに示す ようなユーザ ID入力画面が表示され、検索を行おうするユーザがユーザデータべ一 ス 104に登録されているか否かの確認が行われる。この確認の後、図 6Cに示すよう なオプションの設定画面が表示される。一方、「利用しない」が選択された場合には、 設定ボタン 605はグレーアウトされ、図 6B及び図 6Cのような表示画面は提供されな い。 [0063] In the case of FIG. 6A, "use" is selected, so that a search using the option setting content is performed. Also, when “Use” is selected, the setting button 605 is activated, and when the selection of this setting button 605 is accepted, a user ID input screen as shown in FIG. 6B is displayed and a search is performed. A check is made as to whether the user to be registered is registered in the user database 104. After this confirmation, the option setting screen shown in Fig. 6C is displayed. On the other hand, when “not use” is selected, the setting button 605 is grayed out, and the display screens as shown in FIGS. 6B and 6C are not provided.
[0064] 次に、図 6Bについて説明する。図 6Bは、図 6Aにおいて設定ボタン 605が選択さ れた場合に、ディスプレイ 207に表示される画面である。この画面は、ユーザがユー ザデータベース 104に登録されているか否かを確認するための画面である。  Next, FIG. 6B will be described. FIG. 6B is a screen displayed on the display 207 when the setting button 605 is selected in FIG. 6A. This screen is a screen for confirming whether or not the user is registered in the user database 104.
画面 610において、 611は、検索を行おうとするユーザから、ユーザ登録の有無に関 する入力を受け付ける表示欄である。ここでは、「あり」、「なし」のいずれかが選択可 能となっている。「あり」が選択された場合には、「ユーザ名」及び「パスワード」の入力 を受け付ける入力欄 612及び 613が表示される。一方、「なし」が選択された場合に は、これらの入力欄 612及び 613はグレーアウトされる力、全く表示されない。  In the screen 610, reference numeral 611 denotes a display field for accepting an input regarding the presence / absence of user registration from a user who wants to perform a search. Here, either “Yes” or “No” can be selected. When “Yes” is selected, input fields 612 and 613 for accepting input of “user name” and “password” are displayed. On the other hand, when “None” is selected, these input fields 612 and 613 are not displayed at all as the force to be grayed out.
[0065] また、 614は、決定ボタンであって、入力内容を確定する場合に操作される。 615 はキャンセルボタンであって、ユーザが図 6Aの画面に戻りたい場合に操作される。 決定ボタン 614が操作された際に、ユーザ登録 611が「なし」の設定の場合には、サ ーバへのデータ送信は行わずに、画面を図 6Cに切り替える。一方、ユーザ登録 611 力 S「あり」の設定で、「ユーザ名」及び「パスワード」を受け付けていれば、該受け付け たデータがサーバ 103へ送信される。  [0065] Reference numeral 614 denotes a determination button, which is operated when confirming input contents. A cancel button 615 is operated when the user wants to return to the screen shown in FIG. 6A. If the user registration 611 is set to “None” when the OK button 614 is operated, the screen is switched to FIG. 6C without transmitting data to the server. On the other hand, if “user name” and “password” are accepted in the setting of the user registration 611 force S “Yes”, the accepted data is transmitted to the server 103.
[0066] サーバ 103では、クライアント 101から受信した「ユーザ名」及び「パスワード」と一致 するユーザ名 403及びパスワード 402をユーザデータベース 104から検索する。一 致する「ユーザ名」が登録されて 、る場合には、ユーザデータベース 104に登録され て 、るユーザデータの有無及びユーザ ID401がサーバ 103からクライアント 101に 通知される。クライアント 101では、サーバ 103からの該通知を受信すると、図 6Cの 画面を表示する。一方、一致する「ユーザ名」が登録されていない場合には、エラー メッセージがサーバ 103からクライアント 101に通知される。クライアント 101では、サ ーバ 103からの該エラーメッセージを受信すると、図 6Bの画面を表示して、再度「ュ 一ザ名」及び「パスワード」の入力を受け付ける。 The server 103 searches the user database 104 for a user name 403 and a password 402 that match the “user name” and “password” received from the client 101. one If a matching “user name” is registered, it is registered in the user database 104, and the presence / absence of user data and the user ID 401 are notified from the server 103 to the client 101. Upon receiving the notification from the server 103, the client 101 displays the screen in FIG. 6C. On the other hand, if a matching “user name” is not registered, an error message is notified from the server 103 to the client 101. When the client 101 receives the error message from the server 103, the client 101 displays the screen of FIG. 6B and accepts the input of “user name” and “password” again.
[0067] 次に、図 6Cについて説明する。図 6Cは、図 6Bにおいて決定ボタン 614が選択さ れた後に、ディスプレイ 207に表示される画面である。また、この画面は、サーバ 103 における検索の際に利用されるオプション情報の設定、より具体的には、検索結果に 含まれる各ページの重み付け値を算出するために利用する登録情報の指定を受け 付けるための画面でもある。  [0067] Next, FIG. 6C will be described. FIG. 6C is a screen displayed on the display 207 after the enter button 614 is selected in FIG. 6B. In addition, this screen receives setting of option information used when searching in the server 103, more specifically, designation of registration information used for calculating the weight value of each page included in the search result. It is also a screen for attaching.
[0068] オプション入力画面 620には、大別すると、ページ情報 621、ユーザデータ 622及 びおま力せ 623が示される。ページ情報 621について設定可能な項目には、更新日 時、総参照回数、直近の参照回数、増加アンカー数、ブックマーク登録数がある。こ れらの項目は、 URLデータベース 106に登録されている図 4Cの更新日時 425、総 参照回数 432、直近参照回数 433、増加アンカー数 434、ブックマーク登録数 435 の登録情報にそれぞれ対応している。よって、これらの項目のいずれかが選択された 場合、対応する登録情報は、(図 8と対応して後述するように)サーバ 103における検 索結果に含まれるページついて、表示順を決定する際に利用される。  [0068] The option input screen 620 roughly shows page information 621, user data 622, and manaise 623. Items that can be set for the page information 621 include the update date, the total number of references, the number of latest references, the number of increased anchors, and the number of bookmark registrations. These items correspond to the registration information of the update date and time 425, the total reference count 432, the latest reference count 433, the increased anchor count 434, and the bookmark registration count 435 of Fig. 4C registered in the URL database 106, respectively. . Therefore, when any of these items is selected, the corresponding registration information is used when determining the display order for the pages included in the search results in the server 103 (as will be described later with reference to FIG. 8). Used for
[0069] また、ユーザデータ 622につ 、て設定可能な項目には、年齢、性別、地域属性、職 種、未既婚、年収、車の有無、趣味がある。これらの項目は、 URLデータベース 106 に登録されている図 4Dの総参照回数 441、直近参照回数 442、ブックマーク登録数 443についての登録情報のうち、指定されたユーザデータに関連するものにそれぞ れ対応している。  In addition, items that can be set for the user data 622 include age, sex, regional attributes, occupation, unmarried, annual income, presence of a car, and hobbies. These items are registered information related to the specified user data among the registered information for the total reference count 441, the latest reference count 442, and the bookmark registration count 443 in FIG. 4D registered in the URL database 106, respectively. It corresponds.
[0070] 例えば、ユーザデータ 622のうち年齢が選択された場合には、図 4Dにおけるユー ザデータ 440の年齢のうち、当該指定を行ったユーザの年齢に基づ 、て当該ユーザ が属する世代が決定され、対応する登録情報が特定される。よって、これらの項目の いずれかが選択された場合、対応する登録情報は、(図 8と対応して後述するように) サーバ 103における検索結果に含まれるページついて、表示順を決定する際に利 用される。 [0070] For example, when the age is selected from the user data 622, the generation to which the user belongs is determined based on the age of the user who made the designation out of the age of the user data 440 in FIG. 4D. And corresponding registration information is specified. Therefore, these items When either one is selected, the corresponding registration information is used when determining the display order of pages included in the search result in the server 103 (as will be described later with reference to FIG. 8).
[0071] また、おま力せ 623は、ユーザ側でページ情報 621やユーザデータ 622の指定を 行わない場合に選択できる。おま力せ 623が選択された場合には、例えば、全ての オプション情報を利用して検索を行っても良いし、あるいは、特定のページ情報 621 とユーザデータ 622とを予め設定しておき、当該設定を利用した検索を行っても良い  [0071] Further, Omakase 623 can be selected when the user does not specify the page information 621 or the user data 622. If Random 623 is selected, for example, the search may be performed using all option information, or specific page information 621 and user data 622 may be set in advance and You may search using settings
[0072] なお、オプションにおける設定項目は、上記のものに限定されることなぐ当然にこ れら以外が含まれても良い。 [0072] It should be noted that the setting items in the options are not limited to those described above, and naturally other items may be included.
また、図 6Bに示す画面では、ページ情報 621とユーザデータ 622とについて設定可 能な項目が表示されている力 このような表示は、ユーザデータベース 104に登録さ れ、かつ、ユーザデータ 622の各設定項目について図 4Aに示すようにユーザデー タを漏れなく登録して 、なければ意味がな 、。  In addition, in the screen shown in FIG. 6B, the power that items that can be set for the page information 621 and the user data 622 are displayed. Such a display is registered in the user database 104 and each item of the user data 622 is displayed. As shown in Fig. 4A, the user data must be registered for the setting items without omission.
[0073] 例えば、ユーザによっては、ユーザデータベース 104に登録されていない者もいる 力もしれない。このような場合、ユーザデータ 622の設定項目について設定を受け付 けても、検索に利用することはできない。また、このようなユーザは、図 6Bの画面にお いて、ユーザ登録 611を「なし」に設定しているはずである。そこで、係る設定内容に 対応して、画面 620にはページ情報 621のみを表示し、ユーザデータ 622はグレー アウトするのが好ましい。これによれば、ユーザデータベースに登録されていないュ 一ザであっても、少なくともページの更新日時や直近の参照回数を利用した検索が 可能となる。 [0073] For example, some users may not be able to be registered in the user database 104. In such a case, even if a setting is accepted for the setting item of the user data 622, it cannot be used for the search. Such a user should have set the user registration 611 to “none” in the screen of FIG. 6B. Therefore, it is preferable that only the page information 621 is displayed on the screen 620 and the user data 622 is grayed out corresponding to the setting contents. According to this, even a user who is not registered in the user database can be searched using at least the page update date and the latest reference count.
[0074] また、一部のユーザデータのみを登録し、他のユーザデータは登録して!/、な!/ヽ者も いる力もしれない。このような場合、登録していない項目について設定を受け付けて も、検索に利用することはできない。そこで、サーバ 103から受け付けたユーザデー タベース 104に登録されているユーザデータの有無に関する通知に基づき、ユーザ データ 622の設定項目のうち、ユーザデータベース 104に登録されているユーザデ ータに対応する項目のみを表示し、他をグレーアウトすることが好ましい。これによれ ば、ユーザは少なくとも自分の登録したユーザデータを用いた検索は可能となる。 [0074] Also, it is impossible to register only some user data and register other user data. In such a case, even if settings are accepted for items that are not registered, they cannot be used for searching. Therefore, based on the notification regarding the presence or absence of user data registered in the user database 104 received from the server 103, only the items corresponding to the user data registered in the user database 104 among the setting items of the user data 622 are displayed. It is preferable to display and gray out the others. This For example, the user can perform a search using at least user data registered by the user.
[0075] ユーザはオプション入力を終了すると、決定ボタン 624により入力したオプションの 内容を確定することができる。決定ボタン 624が選択されると、検索画面 601は図 6A に示す内容に戻る。また、キャンセルボタン 625を選択した場合は、図 6Aの画面に 戻る。その際、オプションの設定内容はリセットされても良いし、それまでの入力内容 を保持したままでも良い。  [0075] When the user finishes option input, the user can confirm the contents of the option input by the OK button 624. When the OK button 624 is selected, the search screen 601 returns to the contents shown in FIG. 6A. If the cancel button 625 is selected, the screen returns to the screen in FIG. 6A. At that time, the option settings may be reset, or the previous input contents may be retained.
[0076] <検索処理その 2 (検索処理) >  [0076] <Search process 2 (Search process)>
次に、実際に検索を実行する際の処理の流れについて、図 7のフローチャートを参 照して説明する。  Next, the flow of processing when actually executing a search will be described with reference to the flowchart of FIG.
[0077] まず、クライアント 101において、サーバ 103が提供する検索サービスのページの U RLが選択されると (ステップ S751にお!/、て「YES」 )、クライアント 101からサーバ 10 3に対して、検索画面情報の要求が通知される(701)。サーバ 103では、クライアント 101からの検索画面情報の要求に応じて、クライアント 101において後述する検索情 報を生成するための検索情報生成情報としての検索画面情報を送信する(702)。ク ライアント 101は、サーバ 103から検索画面情報を受信すると、ディスプレイ 207上に 図 6Aの検索画面 601に示すような検索画面を表示する(ステップ S752)。  [0077] First, in the client 101, when the URL of the search service page provided by the server 103 is selected ("YES" in step S751), the client 101 sends a request to the server 103. A request for search screen information is notified (701). In response to the request for search screen information from the client 101, the server 103 transmits search screen information as search information generation information for generating search information to be described later in the client 101 (702). Upon receiving the search screen information from the server 103, the client 101 displays a search screen as shown in the search screen 601 in FIG. 6A on the display 207 (step S752).
[0078] 次に、ユーザ力 キーワードやオプション設定をする力否かなどの入力を受け付け( ステップ S753)、オプション設定がなされる場合には図 6Bの画面を表示して、ユー ザ登録ありと設定された力否かを判定する (ステップ S754)。もし、オプション設定が なされない場合には、以下のステップ S753力ら S756をスキップしてステップ S757 へ移行する。  [0078] Next, an input such as whether or not the user power keyword or option setting is accepted is accepted (step S753), and when option setting is performed, the screen of FIG. It is determined whether or not the force is applied (step S754). If the option is not set, the following steps S753 and S756 are skipped and the process proceeds to step S757.
[0079] 図 6Bに表示する画面において、ユーザ登録 611が「なし」と設定された場合には、 「ユーザ登録あり」と設定されたこととならな 、ので (ステップ S754にお!/、て「NO」 )、 ステップ S756に移行する。一方、ユーザ登録 611が「あり」と設定され、入力欄 612 及び 613に「ユーザ名」及び「パスワード」が入力された場合には、「ユーザ登録あり」 と設定されたこととなる(ステップ S754において「YES」)ので、これらの入力情報をュ 一ザ認証用情報としてサーバ 103に送信する(703)。  [0079] In the screen displayed in FIG. 6B, if the user registration 611 is set to “none”, it means that “user registration is present” is not set (in step S754! / “NO”), proceed to step S756. On the other hand, when the user registration 611 is set as “present” and “user name” and “password” are entered in the input fields 612 and 613, this means that “user registration is present” (step S754). Therefore, the input information is transmitted to the server 103 as user authentication information (703).
[0080] サーバ 103では、クライアントから送信された「ユーザ名」及び「パスワード」を含む ユーザ認証用情報を利用してユーザ認証、即ち、該ユーザがユーザデータベース 1 04に登録されているユーザであるかを検証する(ステップ S755)。検証の結果、該ュ 一ザが登録されている場合には、該ユーザについて、ユーザ ID401とユーザデータ ベース 104に登録されて 、るユーザデータの有無に関する情報とを含むユーザ認証 結果がクライアント 101へ送信される(704)。また、該ユーザが登録されていない場 合には、エラーメッセージを含むユーザ認証結果力 Sクライアント 101へ送信される (7 04)。 [0080] The server 103 includes "user name" and "password" transmitted from the client. User authentication information is used to verify user authentication, that is, whether or not the user is registered in the user database 104 (step S755). If the user is registered as a result of the verification, the user authentication result including the user ID 401 and the information on the presence or absence of the user data registered in the user database 104 for the user is sent to the client 101. It is transmitted (704). If the user is not registered, it is transmitted to the user authentication result S client 101 including an error message (704).
[0081] 次に、ステップ S756では、図 6Cに示すようなオプション入力画面を表示して、ォプ シヨン入力を受け付ける。続いて、検索実行ボタン 603の選択による検索実行指示を 受け付ける (ステップ S757)。検索実行ボタン 603が選択されると、サーバ 103に対 して、ステップ S753及び S756で入力を受け付けたキーワードやオプション設定の 内容と、ユーザ認証結果(704)を受信している場合には、そこに含まれていたユー ザ ID401とを含む検索情報を送信する(705)。ここで、検索を行おうとするユーザが 未登録ユーザの場合には、未登録であることを示す所定のコードをユーザ ID401の 代わりに検索情報に含めて送信しても良い。  Next, in step S756, an option input screen as shown in FIG. 6C is displayed to accept an option input. Subsequently, a search execution instruction by selecting the search execution button 603 is accepted (step S757). When the search execution button 603 is selected, if the server 103 receives the contents of the keyword and option settings received in steps S753 and S756, and the user authentication result (704), it will be displayed. The search information including the user ID 401 included in is transmitted (705). Here, when the user who performs the search is an unregistered user, a predetermined code indicating that the user is not registered may be included in the search information instead of the user ID 401 and transmitted.
[0082] サーバ 103では、クライアント 101から送信された検索情報を受信すると、キーヮー ドに基づ 、て検索処理を行 1、、オプション設定の内容に基づ 、て検索結果を作成し (ステップ S758)、検索結果をクライアント 101へ送信する(706)。クライアント 101は 、サーバ 103から検索結果を受信すると、受信した検索結果をディスプレイ 207の検 索画面 601に表示する(ステップ S759)。  [0082] Upon receiving the search information transmitted from the client 101, the server 103 performs a search process based on the key word, and creates a search result based on the contents of the option settings (step S758). ) And the search result is transmitted to the client 101 (706). When the client 101 receives the search result from the server 103, the client 101 displays the received search result on the search screen 601 of the display 207 (step S759).
[0083] その後、ユーザ力もの入力に従って検索を再度実行する場合は、ステップ S751か らの処理を再開する。もし、ユーザが Webブラウザの閲覧を終了する場合には (ステ ップ S760で「YES」)、クライアント 101からサーバ 103に対して終了通知が送信され (707)、サーバ 103からは終了応答が返される(708)。  [0083] Thereafter, when the search is executed again according to the input by the user, the processing from step S751 is resumed. If the user finishes browsing the Web browser (“YES” in step S760), the client 101 sends a termination notice to the server 103 (707), and the server 103 returns a termination response. (708).
[0084] 次に、図 8を参照して、図 7のステップ S758における処理の詳細を説明する。図 8 は、サーバ 103における検索処理の一例に対応するフローチャートである。  Next, details of the processing in step S758 of FIG. 7 will be described with reference to FIG. FIG. 8 is a flowchart corresponding to an example of search processing in the server 103.
[0085] まず、ステップ S801において、サーバ 103は、クライアント 101から送信された検索 情報を受信すると共に、受信した検索情報の中から、検索を依頼したユーザ (検索依 頼ユーザ)のユーザ ID401を抽出する。次に、ステップ S802において、抽出された ユーザ ID401に基づいて、ユーザデータベース 104からユーザデータを取得する。 なお、検索依頼ユーザがユーザデータベース 104に未登録であった場合には、未登 録ユーザを示すコードは含まれて 、ても、ユーザ ID401は検索情報に含まれて!/、な い。また、ユーザデータベース 104に本来は登録されているユーザであっても、図 6 Aにおいてオプション設定 604を「利用しない」に設定した場合には、図 7のユーザ認 証結果(704)を受信しないので、検索情報にユーザ ID401が含まれていない。これ らのユーザについては、ユーザデータの取得は当然に行われない。 First, in step S801, the server 103 receives the search information transmitted from the client 101, and at the same time receives the search request from the received search information (the search request). The user ID 401 of the requesting user) is extracted. In step S802, user data is acquired from the user database 104 based on the extracted user ID 401. When the search requesting user is not registered in the user database 104, the code indicating the unregistered user is included, but the user ID 401 is not included in the search information! /. Further, even if the user is originally registered in the user database 104, if the option setting 604 in FIG. 6A is set to “not use”, the user authentication result (704) in FIG. 7 is not received. Therefore, the user ID 401 is not included in the search information. Of course, user data is not acquired for these users.
次に、ステップ S803において、検索情報に含まれるキーワードに基づいて公知の手 法で検索用データベース 107を検索し、ステップ S804においてキーワードに基づく 検索条件に合致するデータを検索結果 1として取得する。この検索結果 1は、検索処 理によって得られた検索結果であって、ユーザデータ(即ち、検索依頼ユーザの職 業や年齢など)や、ページの情報 (更新日時や、参照回数等)とは無関係に、専らべ ージ内に指定されたキーワードや当該キーワードに類似する語をどれだけ含むか、と いった基準によりキーワードとの関連の度合いを決定し、その関連性の順にページを 並べたものとして得られる。  Next, in step S803, the search database 107 is searched by a known method based on the keywords included in the search information, and data matching the search conditions based on the keywords is acquired as the search result 1 in step S804. This search result 1 is the search result obtained by the search process. It is the user data (that is, job title and age of the search requesting user) and page information (update date and time, reference count, etc.) Regardless of the criteria, the degree of association with the keyword is determined based on the criteria such as the keyword specified in the page and how many words are similar to the keyword, and the pages are arranged in the order of the association. Obtained as a thing.
[0086] ステップ S805では、検索情報に基づ!/、て、検索依頼ユーザのオプション設定 604 の内容を識別する。もし、オプション設定 604においてオプションを「利用しない」と設 定されて!/、た場合には、ステップ S816に移行して検索結果 1をクライアント 101へ送 信する。一方、「利用する」と設定されていた場合には、ステップ S806へ移行して、 検索結果 1の順位に基づいて各ページのポイント Psを算出する。例えば、検索結果 1に 100件のページが含まれて!/、たとすると、その順位に基づ!/、て頭力もポイントを 1 00、 99、 98 · · · 1のように付カロすること力 Sできる。また、上位 10件のみに 100、 90、 8 0· · 10のポイントをそれぞれ与えても良い。いずれにしても、検索結果 1の順位に基 づく重み付けを、 Psとして検索結果 1に含まれる各ページにっ 、て与える。  In step S805, the contents of the option setting 604 of the search request user are identified based on the search information! /. If the option setting 604 is set to “not use” in the option setting 604, the process proceeds to step S816 and the search result 1 is transmitted to the client 101. On the other hand, if “use” is set, the process proceeds to step S806, and the point Ps of each page is calculated based on the ranking of the search result 1. For example, if search result 1 contains 100 pages! /, Then based on the ranking! /, The head will also be scored as 1 00, 99, 98 ... 1 Power S can be. Only the top 10 points may be given points of 100, 90, 80 ... 10. In any case, the weight based on the ranking of the search result 1 is given to each page included in the search result 1 as Ps.
[0087] 次に、ステップ S807では検索結果 1に含まれるページの順位を Nuとして、 Nuを 1 に設定する。次に、ステップ S808において、検索結果 1における順位が Nu番目の ページを選択し、当該ページの URLに基づいて、当該ページについて URLデータ ベース 106に情報が登録されていれば、該登録されている登録情報を全て取得する 。次に、ステップ S809において、検索情報において設定されたオプション設定の内 容と、ステップ S802において取得されているユーザデータがある場合には当該ユー ザデータとに基づいて、取得した登録情報の中から、当該ページの重み付けに利用 する登録情報を絞り込む。 Next, in step S807, the order of pages included in the search result 1 is set to Nu, and Nu is set to 1. Next, in step S808, the page with the Nu rank in search result 1 is selected, and the URL data for the page is based on the URL of the page. If information is registered in the base 106, all the registered information is acquired. Next, in step S809, based on the contents of the option setting set in the search information and the user data acquired in step S802, if there is the user data, from the acquired registration information, Narrow down the registration information used for weighting the page.
[0088] 例えば、図 6Cの場合、ページ情報 621は「直近の参照回数」のみが選択されてお り、ユーザデータ 622については「年齢」と「職種」が選択されている。よって、図 4C及 び図 4Dに示す登録情報のうち、直近参照回数 433と、検索依頼ユーザの年齢及び 職種に対応した総参照回数 441、直近参照回数 442、ブックマーク登録数 443が選 択され、これらの登録情報のみに絞り込みが行われる。  For example, in the case of FIG. 6C, only “last reference count” is selected as the page information 621, and “age” and “job type” are selected as the user data 622. Therefore, among the registration information shown in FIG. 4C and FIG. 4D, the latest reference count 433, the total reference count 441, the latest reference count 442, and the bookmark registration count 443 corresponding to the age and job type of the search request user are selected. Only these pieces of registration information are narrowed down.
[0089] ここでは図 4C及び図 4Dに記載された登録情報をそれぞれ利用して絞り込みを行 う場合を説明したが、どの登録情報を利用するかは、オプション設定の内容に基づい て決定されるため、図 4C又は図 4Dの一方のみを利用して絞り込みを行うことも当然 に可能である。  [0089] In this example, the case has been described in which the registration information described in FIG. 4C and FIG. 4D is used for narrowing down. However, which registration information is used is determined based on the contents of option settings. Therefore, it is naturally possible to narrow down using only one of Fig. 4C or Fig. 4D.
[0090] なお、ステップ S808及びステップ S809においては、ー且登録情報を全て読み出 し、その後で絞り込みをかけている力 これは一例として説明しただけである。即ち、 検索情報において設定されたオプション設定の内容と、ユーザデータとに基づいて 直接対応する登録情報を URLデータベース 106から取得するようにしても良い。  [0090] It should be noted that in steps S808 and S809, the force of reading out all of the registration information and then narrowing down this is only described as an example. In other words, the corresponding registration information may be acquired directly from the URL database 106 based on the contents of the option settings set in the search information and the user data.
[0091] 次に、ステップ S810では、絞り込まれた登録情報を Pr、重み付け値を Pwとして、 登録情報に基づくポイント: Puを算出する(Pu=Pr X Pw)。  Next, in step S810, the narrowed registration information is set as Pr and the weighting value is set as Pw, and a point based on the registration information: Pu is calculated (Pu = Pr X Pw).
ここで、当該ページ自体が URLデータベース 106に登録されていなかった場合や、 当該ページ自体は登録されているものの、絞り込まれた登録情報に対応する情報が 登録されていな力つた場合 (例えば、該ページには特定の趣味以外の人はアクセス しない場合もあり得る。 )には、 Pr=0として計算する。本発明では、このポイント Puを 利用することで、当該ページと検索依頼ユーザとの関連性や、当該ページの情報の 有用性を検索結果に反映させることが可能となる。即ち、総参照回数 441や直近参 照回数 442、ブックマーク登録数 443を利用することで、検索依頼ユーザと同種の職 業を選択した他のユーザが数多く参照しているページや、ブックマークに登録してい るページを検索結果の上位にランクさせることが可能となる。また、総参照回数 432、 直近参照回数 433、増加アンカー数 434、ブックマーク登録数 435を利用することで 、ユーザの職業や、趣味といった枠を越えて、幅広くユーザに支持されているページ や、アンカーを増やして積極的に情報を更新しているページを検索結果の上位にラ ンクさせることが可能となる。 Here, when the page itself is not registered in the URL database 106, or when the page itself is registered but information corresponding to the narrowed registration information is not registered (for example, the The page may not be accessed by anyone other than a specific hobby. In the present invention, by using this point Pu, it is possible to reflect the relationship between the page and the search requesting user and the usefulness of the information on the page in the search result. In other words, by using the total reference count 441, the latest reference count 442, and the bookmark registration count 443, it is registered in the page or bookmark that many other users who have selected the same type of job as the search request user refer to. Have Can be ranked higher in the search results. In addition, by using the total number of references 432, the number of recent references 433, the increased number of anchors 434, and the number of bookmark registrations 435, pages and anchors that are widely supported by users beyond the user's occupation and hobbies can be used. It is possible to rank pages that are actively updating information by increasing the number of search results.
[0092] ここで、 Prは総参照回数など、カウントされた数値情報である場合にはそのまま数 値として利用することができる。しかし、更新日時 425のように、数値として直接には 使えない情報については、現在の日時からの差分を求め、さらにその逆数を求めるこ とにより、 Pr値とすることができる。いずれにしても、現在の日時に近くなるほど Prの 値が大きくなるように変換できればよい。また、重み付け値 Pwについては、全ての登 録情報につ 、て均一に与えられても良 、し、特定の登録情報につ!、てより高!、値が 与えられても良い。例えば、同じ総参照回数にしても、総参照回数 441の重み付け 値 Pwを 100とし、総参照回数 432の重み付け値を 10とする、といった方法もある。ま た、更新日時 425のように、直接 Pr値として用いることができない登録情報について は、他の登録情報とは異なる重み付け値を用意しても良い。  Here, Pr can be used as a numerical value as it is when it is counted numerical information such as the total number of times of reference. However, for information that cannot be used directly as a numerical value, such as the update date and time 425, the Pr value can be obtained by obtaining the difference from the current date and time, and further obtaining the reciprocal thereof. In any case, it is only necessary to convert the Pr value so that it becomes closer to the current date and time. Further, the weighting value Pw may be given uniformly for all registration information, or may be given a value for specific registration information. For example, even if the total number of reference times is the same, there is a method in which the weighting value Pw of the total number of reference times 441 is set to 100 and the weighting value of the total number of reference times 432 is set to 10. For registration information that cannot be directly used as a Pr value, such as the update date and time 425, a different weighting value from other registration information may be prepared.
[0093] 次に、ステップ S811では、ステップ S810において算出された各登録情報につい てのポイント Puを合計して Pustを算出する。このポイント Pustが登録情報に基づい て各ページに与えられた重み付けとなる。  [0093] Next, in step S811, the points Pu for each piece of registration information calculated in step S810 are summed to calculate Pust. This point Pust is the weight given to each page based on the registration information.
[0094] ステップ S812では、全てのページについて Pustが算出されたかどうかが判定され 、残っているページがある場合 (ステップ S812において「NO」)には Nuをインクリメン トしてステップ S808に戻りポイント Pustの算出のための処理を継続する。一方、全て のページについて Pustが算出された場合 (ステップ S812において「YES」)には、ス テツプ S814に移行して各ページ毎に、検索結果 2を決定するためのポイント: Puall を Puall = Ps + Pustにより算出する。これにより、検索結果と検索依頼ユーザのォプ シヨン設定内容との両方を反映した検索結果を得ることができる。尚、本実施形態で は Psと Pustを単純に足し合わせる場合を記載した力 ここで更に重み付けを行って 、例えば Puall = Ps + Pust' N (Nは所定数)としても良い。このようにすれば、ユーザ のオプション設定の内容が生成される検索結果に更に反映されることとなる。また、 検索結果 1の順位を全く考慮しなくても良い。この場合は、ステップ S806〖こおける Ps の算出工程と、本工程とがスキップされ、 Puall=Pustとなる。 [0094] In step S812, it is determined whether or not Pust has been calculated for all pages. If there are remaining pages ("NO" in step S812), Nu is incremented and the process returns to step S808 to return to point Pust The process for calculating is continued. On the other hand, if Pust has been calculated for all pages (“YES” in step S812), the process moves to step S814 and points for determining search result 2 for each page: Puall is Puall = Ps + Calculated with Pust. Thereby, it is possible to obtain a search result reflecting both the search result and the contents of the option setting of the search requesting user. In the present embodiment, the force described in the case where Ps and Pust are simply added is further weighted here, for example, Puall = Ps + Pust ′ N (N is a predetermined number). In this way, the contents of the user option setting are further reflected in the generated search result. Also, The ranking of search result 1 need not be considered at all. In this case, the step of calculating Ps in step S806 and this step are skipped, and Puall = Pust.
[0095] 次にステップ S815では、ステップ S814にお!/、て算出された Puallの値に基づ!/、て[0095] Next, in step S815, based on the Puall value calculated in step S814! /,
Puallが大き 、順にページの順位を決定し、検索結果 1の並び順をソートして検索結 果 2を作成する。ステップ S816では、検索結果 2 (ステップ S805から直接移行してき た場合は検索結果 1)をクライアント 101へ送信する。 Puall decides the order of the pages in order of size, sorts the order of search result 1 and creates search result 2. In step S816, search result 2 (or search result 1 if directly transferred from step S805) is transmitted to client 101.
[0096] 以上のように、本実施形態に対応するサーバ 103では、検索依頼ユーザのユーザ データやページの内容以外の情報に基づ 、て検索処理を行 、、検索結果を作成す ることがでさる。 As described above, the server 103 corresponding to the present embodiment can perform search processing based on information other than the user data of the search request user and the contents of the page, and create a search result. I'll do it.
[0097] より具体的には、職業、年齢、趣味といったユーザ個人の情報を独立した項目とし て取り扱い、項目の共通するユーザの統計的情報 (例えば、 10代のユーザの総参照 回数や、ゴルフを趣味とするユーザの直近の参照回数など)を利用して、検索依頼ュ 一ザに提供する価値のある検索結果を作成することができる。  [0097] More specifically, individual user information such as occupation, age, and hobby is handled as an independent item, and statistical information of users with common items (for example, the total number of times teenage users are referred to, The search results that are worth providing to the search request user can be created using the most recent reference frequency of the user who has a hobby.
[0098] また、検索に際しては、利用するユーザデータをオプション設定 604によりユーザ が予め指定することができる。これにより、積極的に利用すべきユーザデータの絞り 込みをユーザ自らが行うこととなり、ユーザが本来意図したキーワードと関連性の高 Further, when searching, user data to be used can be designated in advance by option setting 604. As a result, the user himself / herself narrows down user data that should be actively used, and is highly relevant to the keyword originally intended by the user.
V、ページを高 、確率で絞り込むことが可能となる。 V, page can be narrowed down with high probability.
[0099] 例えば、趣味が「ゴルフ」で、職種が「コンピュータプログラマ」であるようなユーザが 、キーワードとして「ドライバー」を入力した場合、ユーザが「趣味」と「職種」のどちらを 優先的に扱うかを指定しなければ、ゴルフにおける「ドライバー」に関連するページと 、コンピュータプログラムに関連する「ドライバー」に関連するページとが混合して検索 結果に含まれることとなる。しかし、ユーザが予めオプション設定 604において「趣味」 を選択していれば、「職種」に関連するページは重み付けの対象から除外されるので 、ゴルフにおける「ドライバー」と関連するページが確実に検索結果の上位にランクさ れるようになる。 [0099] For example, when a user whose hobby is "golf" and whose occupation is "computer programmer" inputs "driver" as a keyword, the user preferentially selects either "hobby" or "profession" If not specified, the page related to “driver” in golf and the page related to “driver” related to the computer program are mixed and included in the search result. However, if the user has previously selected “hobby” in the option setting 604, the page related to “job type” is excluded from the weighting target, so that the page related to “driver” in golf is surely retrieved. It will be ranked at the top.
[0100] また、本実施形態では、直近参照回数に基づ!、てページに重み付けを行って!/、る ので、最近立ち上げられたば力りで総参照回数はあまり大きくないページであっても 、人気のあるページであれば、当然に直近の参照回数が大きくなり、他のページより もポイント(Pu)が高くなる。従って、このようなページが検索結果の上位にランクされ るようになる。また、リンク切れしているページがあっても、そのようなページは、直近 参照回数が伸びないのが通常であるから、この直近参照回数を利用することで、検 索結果力 除外することが可能となる。 [0100] Also, in this embodiment, the page is weighted based on the number of most recent references !, so the page is a page whose total number of references is not very large due to recently launched power. However, if it is a popular page, the number of times of the most recent reference is naturally larger than other pages. The point (Pu) will be higher. Therefore, such pages are ranked higher in the search results. In addition, even if there is a page with a broken link, it is normal that such a page does not increase in the number of the latest reference. Therefore, by using this number of the latest reference, it is possible to exclude the search result power. It becomes possible.
[0101] 更に、増加アンカー数を利用すれば、ブログ (ウェブログ)等において、積極的に情 報を収集し、公開して 、るようなページを検索結果の上位にランクすることが可能とな る。 [0101] Furthermore, if the increased number of anchors is used, information can be actively collected and published on blogs (web logs), etc., and such pages can be ranked higher in the search results. Become.
[0102] [その他の実施形態]  [0102] [Other Embodiments]
以上の処理 (例えば上記図 5、図 7又は図 8に示したフローチャートに従った処理等 )をプログラムとして CD— R、 ROMや DVD— ROM、 MO等の記憶媒体に記憶させ、 この記憶媒体に記憶されているプログラムをコンピュータに読み込ませる (インスト一 ル、もしくはコピーさせる)、或いは、ネットワークを介して所定のサーバ力 ダウン口 ードすることで、このコンピュータは以上の処理を行うことができる。よって、この記憶 媒体も本発明の範疇にあることは明白である。本発明は上記実施の形態に制限され るものではなぐ本発明の精神及び範囲力 離脱することなぐ様々な変更及び変形 が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。  The above processing (for example, processing according to the flowchart shown in FIG. 5, FIG. 7 or FIG. 8 above) is stored as a program in a storage medium such as a CD-R, ROM, DVD-ROM, MO, etc. This computer can perform the above processing by loading the stored program into the computer (installing or copying), or downloading a predetermined server power via the network. Therefore, it is clear that this storage medium is also within the scope of the present invention. The present invention is not limited to the above-described embodiment, and various changes and modifications can be made without departing from the spirit and scope of the present invention. Therefore, in order to make the scope of the present invention public, the following claims are attached.

Claims

請求の範囲 The scope of the claims
[1] クライアント端末力 入力された検索情報に基づいてインターネット上の Webぺー ジの情報を検索し、検索結果を前記クライアント端末に送信する情報検索装置であ つて、  [1] Client terminal power An information search device that searches information on a Web page on the Internet based on input search information and transmits a search result to the client terminal.
Webページに関する登録情報を格納する登録情報格納手段と、  Registration information storage means for storing registration information about a web page;
前記クライアント端末から前記検索情報を受信する受信手段と、  Receiving means for receiving the search information from the client terminal;
前記検索情報に含まれるキーワードに関連する Webページを検索用情報力 検索 し、第 1の検索結果を生成する第 1の検索結果生成手段と、  A first search result generating means for searching for a web page related to a keyword included in the search information and generating a first search result;
前記登録情報格納手段に格納された、前記第 1の検索結果に含まれる Webぺー ジに関する登録情報から、前記検索情報に含まれる前記登録情報の利用の有無に 関する設定情報を利用して第 1の登録情報を選択する選択手段と、  From the registration information regarding the Web page included in the first search result stored in the registration information storage means, the first information is used by using setting information regarding whether or not the registration information is included in the search information. A selection means for selecting registration information of
前記第 1の登録情報に基づ!、て、前記第 1の検索結果に含まれる Webページの重 み付け値を、該 Webページ毎に算出する算出手段と、  Based on the first registration information !, calculating means for calculating a weight value of the Web page included in the first search result for each Web page;
Webページ毎に算出された前記重み付け値に基づき、前記第 1の検索結果に含ま れる Webページの順位を決定する順位決定手段と、  Rank determining means for determining the rank of the web page included in the first search result based on the weighting value calculated for each web page;
決定された前記順位により前記第 1の検索結果に含まれる Webページをソートして 第 2の検索結果を生成する第 2の検索結果生成手段と、  Second search result generation means for generating a second search result by sorting the web pages included in the first search result according to the determined ranking;
前記第 2の検索結果を前記クライアント端末に送信する送信手段と  Transmitting means for transmitting the second search result to the client terminal;
を備えることを特徴とする情報検索装置。  An information retrieval apparatus comprising:
[2] 前記登録情報には、前記 Webページにっ 、て、少なくとも、更新日時、複数のユー ザにより参照された回数の総計、直近の所定期間内に複数のユーザにより参照され た回数の合計、該 Webページをブックマークに登録しているユーザ数、及び、直近 の所定期間内に追加されたアンカー数の 、ずれかが含まれ、 [2] The registration information includes at least the update date and time, the total number of times referred to by a plurality of users, and the total number of times referred to by a plurality of users within the most recent predetermined period. , The number of users who have registered the Web page in the bookmark and the number of anchors added within the most recent predetermined period are included.
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指 定する情報であって、  The setting information is information for specifying the registration information used for calculating the weighting value,
前記選択手段は、前記設定情報において指定された前記登録情報を、前記第 1の 登録情報として選択することを特徴とする請求項 1に記載の情報検索装置。  2. The information search apparatus according to claim 1, wherein the selection unit selects the registration information designated in the setting information as the first registration information.
[3] 前記クライアント端末のユーザに固有のユーザデータを、ユーザ毎に格納するユー ザデータ格納手段と、 [3] A user that stores user data specific to the user of the client terminal for each user. The data storage means;
前記検索情報から、前記ユーザを特定するための識別情報を抽出する第 1の抽出 手段と、  First extraction means for extracting identification information for identifying the user from the search information;
前記ユーザデータ格納手段に格納されたユーザデータのうち、前記識別情報に対 応する第 1のユーザデータを取得するユーザデータ取得手段とを更に備え、 前記選択手段は、前記検索情報に含まれる前記登録情報の利用の有無に関する 設定情報と、前記第 1のユーザデータとを利用して第 1の登録情報を選択することを 特徴とする請求項 1に記載の情報検索装置。  User data acquisition means for acquiring first user data corresponding to the identification information among user data stored in the user data storage means, and the selection means is included in the search information. 2. The information search apparatus according to claim 1, wherein the first registration information is selected using setting information relating to presence / absence of use of registration information and the first user data.
[4] 前記ユーザデータには、対応するユーザについて、少なくとも、年齢、性別、地域 属性、職種、未既婚、住居形態、年収、車の所有、及び、趣味のいずれかに関する 情報が含まれ、 [4] The user data includes at least information on any of age, gender, regional attribute, occupation, unmarried, residence type, annual income, car ownership, and hobbies for the corresponding user.
前記登録情報には、前記 Webページについて、少なくとも、複数のユーザにより参 照された回数の総計、直近の所定期間内に複数のユーザにより参照された回数の 合計、該 Webページをブックマークに登録しているユーザ数、直近の所定期間内に 追加されたアンカー数、前記ユーザデータ毎の前記総計、前記回数の合計、前記ュ 一ザ数、のいずれかが含まれ、  In the registration information, at least the total number of times that the Web page has been referred to by a plurality of users, the total number of times that the Web pages have been referred to within a predetermined period, and the Web page are registered in the bookmark. Or the number of anchors added within the most recent predetermined period, the total for each of the user data, the total of the number of times, or the number of users.
前記設定情報は、前記重み付け値を算出するために利用する前記登録情報を指定 する情報であって、  The setting information is information that specifies the registration information used to calculate the weighting value,
前記選択手段は、前記設定情報において指定された前記登録情報のうち、少なく とも前記第 1のユーザデータに対応する登録情報を、前記第 1の登録情報として選択 することを特徴とする請求項 3に記載の情報検索装置。  The selection means selects at least registration information corresponding to the first user data among the registration information specified in the setting information as the first registration information. The information search device described in 1.
[5] 前記算出手段は、前記第 1の検索結果に含まれる Webページの該第 1の検索結果 における順位に更に基づいて、前記重み付けを算出することを特徴とする請求項 1 に記載の情報検索装置。 [5] The information according to claim 1, wherein the calculating means calculates the weight based further on a rank of the Web page included in the first search result in the first search result. Search device.
[6] 前記設定情報に、前記重み付けを算出するために利用する前記登録情報の指定 が無かった場合には、前記選択手段は前記第 1の情報を選択せず、 [6] If the setting information does not specify the registration information used to calculate the weighting, the selection means does not select the first information,
前記送信手段は、前記第 1の検索結果を前記クライアント端末へ送信することを特 徴とする請求項 1に記載の情報検索装置。 2. The information search apparatus according to claim 1, wherein the transmission means transmits the first search result to the client terminal.
[7] 前記クライアント端末へ、前記検索情報を生成するための検索情報生成情報を送 信する生成情報送信手段を更に備え、 [7] The apparatus further comprises generation information transmission means for transmitting search information generation information for generating the search information to the client terminal,
前記クライアント端末では、前記検索情報生成情報を利用して前記キーワードの入 力と、前記登録情報の利用の有無に関する設定入力とが受け付けられることを特徴 とする請求項 1に記載の情報検索装置。  2. The information search apparatus according to claim 1, wherein the client terminal accepts input of the keyword and setting input regarding whether to use the registration information using the search information generation information.
[8] コンピュータを、請求項 1に記載の情報検索装置として機能させるためのコンビユー タプログラム。 [8] A computer program for causing a computer to function as the information retrieval device according to claim 1.
[9] 請求項 8に記載のコンピュータプログラムを格納したコンピュータで読み取り可能な 記憶媒体。  [9] A computer-readable storage medium storing the computer program according to claim 8.
PCT/JP2005/003928 2005-03-07 2005-03-07 Information retrieving device, computer program, and recording medium WO2006095409A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2005/003928 WO2006095409A1 (en) 2005-03-07 2005-03-07 Information retrieving device, computer program, and recording medium
JP2007506942A JP4527770B2 (en) 2005-03-07 2005-03-07 Information retrieval apparatus, computer program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2005/003928 WO2006095409A1 (en) 2005-03-07 2005-03-07 Information retrieving device, computer program, and recording medium

Publications (1)

Publication Number Publication Date
WO2006095409A1 true WO2006095409A1 (en) 2006-09-14

Family

ID=36953020

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/003928 WO2006095409A1 (en) 2005-03-07 2005-03-07 Information retrieving device, computer program, and recording medium

Country Status (2)

Country Link
JP (1) JP4527770B2 (en)
WO (1) WO2006095409A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009003520A (en) * 2007-06-19 2009-01-08 Mic 9 Co Ltd Database server device, method of providing search service, and related method
JP2009282593A (en) * 2008-05-20 2009-12-03 Yahoo Japan Corp Method, server and program for managing index data for retrieving content
JP2010506255A (en) * 2006-09-29 2010-02-25 グーグル インコーポレイテッド Bookmarking and ranking
JP2010508579A (en) * 2006-10-25 2010-03-18 マイクロソフト コーポレーション Personalized search using macros
JP2011054189A (en) * 2005-05-06 2011-03-17 Nhn Corp Personalized search method and personalized search system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (en) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving
JP2002215671A (en) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> Information retrieval device and information retrieval method
JP2002351916A (en) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Device and method for retrieving web information and program making computer execute this method
JP2003186907A (en) * 2001-12-13 2003-07-04 Fujitsu Ltd Profile information retrieval method and device, program, and recording medium
JP2003281179A (en) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd Retrieval site server device, retrieval information display control method, program and recording medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002032401A (en) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp Method and device for document retrieval and computer- readable recording medium with recorded program making computer actualize method for document retrieving
JP2002215671A (en) * 2001-01-16 2002-08-02 Nippon Hoso Kyokai <Nhk> Information retrieval device and information retrieval method
JP2002351916A (en) * 2001-05-30 2002-12-06 Bevoid Corporation Ltd Device and method for retrieving web information and program making computer execute this method
JP2003186907A (en) * 2001-12-13 2003-07-04 Fujitsu Ltd Profile information retrieval method and device, program, and recording medium
JP2003281179A (en) * 2002-03-22 2003-10-03 Hitachi Information Systems Ltd Retrieval site server device, retrieval information display control method, program and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054189A (en) * 2005-05-06 2011-03-17 Nhn Corp Personalized search method and personalized search system
JP2010506255A (en) * 2006-09-29 2010-02-25 グーグル インコーポレイテッド Bookmarking and ranking
JP2010508579A (en) * 2006-10-25 2010-03-18 マイクロソフト コーポレーション Personalized search using macros
JP2009003520A (en) * 2007-06-19 2009-01-08 Mic 9 Co Ltd Database server device, method of providing search service, and related method
JP2009282593A (en) * 2008-05-20 2009-12-03 Yahoo Japan Corp Method, server and program for managing index data for retrieving content

Also Published As

Publication number Publication date
JPWO2006095409A1 (en) 2008-08-14
JP4527770B2 (en) 2010-08-18

Similar Documents

Publication Publication Date Title
US8732169B2 (en) Lateral search
US6718365B1 (en) Method, system, and program for ordering search results using an importance weighting
US7617191B2 (en) Search service that accesses and highlights previously accessed local and online available information sources
KR101130420B1 (en) System and method for a unified and blended search
US7542965B2 (en) Method, apparatus, and computer-readable medium for searching and navigating a document database
JP4005425B2 (en) Search result ranking change processing program, search result ranking change processing program recording medium, and content search processing method
US8775396B2 (en) Method and system for searching a wide area network
US8577868B1 (en) Bookmarks
JP5049223B2 (en) Retrieval device, retrieval method and program for automatically estimating retrieval request attribute for web query
US20080104042A1 (en) Personalized Search Using Macros
US20040204958A1 (en) Electronic registration manager for business directory information
WO2007059087A2 (en) Selecting advertisements in social bookmarking system
US20070239692A1 (en) Logo or image based search engine for presenting search results
JP2003281179A (en) Retrieval site server device, retrieval information display control method, program and recording medium
US8244704B2 (en) Recording medium recording object contents search support program, object contents search support method, and object contents search support apparatus
JP4527770B2 (en) Information retrieval apparatus, computer program, and storage medium
JP4344596B2 (en) Content search system, content search program, and recording medium
JP2007034772A (en) Optimum display system for web site search result, its method and its program
EP2017752A1 (en) Information processing apparatus, information processing method and program
JP4912384B2 (en) Document search device, document search method, and document search program
US8131752B2 (en) Breaking documents
JP2013011940A (en) Information providing server, information retrieval system, information retrieval method, and information retrieval program
JP2004185095A (en) Information retrieval system, information retrieval method, and program
KR101878937B1 (en) System for providing personalized information, method thereof, and recordable medium storing the method
JP4528202B2 (en) File search method, file search device, and file search program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007506942

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: RU

WWW Wipo information: withdrawn in national office

Country of ref document: RU

122 Ep: pct application non-entry in european phase

Ref document number: 05720200

Country of ref document: EP

Kind code of ref document: A1

WWW Wipo information: withdrawn in national office

Ref document number: 5720200

Country of ref document: EP