WO2006008919A1 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
WO2006008919A1
WO2006008919A1 PCT/JP2005/011786 JP2005011786W WO2006008919A1 WO 2006008919 A1 WO2006008919 A1 WO 2006008919A1 JP 2005011786 W JP2005011786 W JP 2005011786W WO 2006008919 A1 WO2006008919 A1 WO 2006008919A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
search
target
target information
original
Prior art date
Application number
PCT/JP2005/011786
Other languages
English (en)
French (fr)
Inventor
Takeshi Sagara
Original Assignee
The University Of Tokyo
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by The University Of Tokyo filed Critical The University Of Tokyo
Priority to JP2006524541A priority Critical patent/JP4035623B2/ja
Publication of WO2006008919A1 publication Critical patent/WO2006008919A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Definitions

  • the present invention relates to an information processing apparatus, a program, and the like for efficiently searching for store target information described on a homepage on the WEB, for example.
  • a search is performed by evaluating a relevance between home pages according to a no-per-link defined between home pages or a user search request.
  • a search method including a step of outputting a search result as a homepage and a link series according to the inquiry content specified by the user terminal.
  • Patent Document 1 JP 2003-203089 (first page, Fig. 1 etc.)
  • Patent Document 2 JP 2001-344283 (first page, Fig. 1 etc.)
  • Non-patent document 1 Gurunavi website, Internet URL: http: ⁇ www.gnavi.co.jp
  • the information processing apparatus includes a receiving unit that receives search information that is information for specifying two or more search targets, and information relating to evaluation of two or more search targets specified by the search information.
  • An information processing apparatus comprising: a target information acquisition unit that acquires two or more original information powers of two or more target information, and an output unit that outputs the target information of the two or more search targets.
  • the information processing apparatus is the output unit of the information processing apparatus according to the first aspect of the invention.
  • summarizing means for summarizing the two or more pieces of target information, obtaining two or more pieces of summary information, and summary information output means for outputting the two or more pieces of summary information.
  • the summarizing means in the information processing apparatus of the second invention includes a word extracting means for extracting a word from the target information, and for each word extracted by the word extracting means. , A word appearance count for each search target for calculating the appearance count for each search target, and summary information of each search target from the target information based on the appearance count Summarization acquisition means for acquiring.
  • the summarizing means includes a word total appearance number calculating means for calculating the number of appearances in all target information of all search targets for each word extracted by the word extraction means, and the word for each search target.
  • a ratio calculating means for calculating a ratio between the number of appearances for each search target calculated by the appearance count calculating means and the number of appearances in all target information calculated by the word total appearance count calculating means, and the ratio calculating means It further comprises word list creation means for creating a word list for each search object, arranged from words with a high ratio, and the summary acquisition means of the information processing device of the third invention is based on the word list for each search object. It is preferable to obtain summary information of each search target from the target information.
  • the target information acquisition unit also acquires link information that is information indicating a location of information in which the target information is described
  • the reception unit includes the summary A summary information selection instruction that is an instruction for information is also received, and when the reception unit receives a summary information selection instruction, target information that is a source of summary information corresponding to the summary information selection instruction is described.
  • the apparatus further includes an original information acquisition unit that acquires the original information, and the output unit includes an original information output unit that also outputs the original information acquired by the original information acquisition unit. It is the structure which also comprises.
  • the powerful configuration is suitable for users who are not satisfied with the summary information alone because the original information can be easily acquired.
  • the target information acquisition unit also acquires link information that is information indicating a location of information in which the target information is described
  • the output unit includes the link Link symbol output means for outputting link symbol information that is information corresponding to the information
  • the accepting unit also accepts a link symbol selection instruction that is an instruction for the link symbol information
  • an original information acquisition unit that acquires original information, which is information describing target information indicated by the link information, based on link information corresponding to the instructed link symbol information
  • the output unit outputs original information obtained by the original information acquisition unit.
  • the information output means is also provided.
  • a powerful configuration is preferable because a user who wants to acquire original information without reading the summary can easily acquire the original information.
  • the output unit includes a ranking determination unit that ranks the two or more search targets based on the target information of the two or more search targets. Further, based on the ranking of the ranking determination means, the target information or Z and summary information of the two or more search targets are output.
  • the search target information such as stores that the user wants is ranked and output. Therefore, it is possible to output information that the user desires in an easy-to-see form.
  • the ranking determination means determines whether the number of characters of the target information to be searched for two or more or Z and whether the target information includes telephone number information. , Or Z and target information are listed, and based on the page ranking of the original information! /, The two or more search targets are ranked.
  • the search information includes search point information that is information related to a search point, and target group information that is information for specifying a search target group.
  • Behavior identification is behavioral characteristics of urban people who act mainly at the station, or behavioral characteristics that if the restaurant is delicious, it will walk about a few minutes on foot from the station.
  • the target information acquisition unit includes search target name information that is information indicating the name of the search target and telephone number information that is information indicating the telephone number of the search target.
  • a search target information group storage means for storing and searching for a search target information group having at least one search target information having address information which is information indicating a search target address, and based on the search information.
  • the search target information acquisition means for acquiring part or all of the search target information from the search target information group storage means, and the search target information acquired by the search target information acquisition means Specified by the search information based on part or all of
  • a target information acquisition means for acquiring target information that is information relating to two or more search target targets.
  • the search information further includes search range information that is information for specifying a search range from a search point indicated by the search point information, and the search target
  • the information acquisition means selects one or more search target information from the search target information group storage means based on the search point information included in the search information, the address information of the search target, and the search range information. Then, part or all of the selected search target information is acquired.
  • the search target information acquisition means takes the longitude and latitude of the search point information included in the search information and the longitude and latitude of the address information of the search target.
  • the distance between the search point indicated by the search point information and the search target point indicated by the address information is calculated from the two longitudes and latitudes, and the condition indicated by the search range information is calculated based on the distance.
  • one or more search target information is selected from the search target information group storage means, and a part or all of the selected search target information is acquired.
  • station power is also search information such as 10 minutes on foot, it is possible to obtain search target information such as stores that can be targeted fairly accurately.
  • the source information which is information from which the target information is acquired, is information with a hierarchical tag
  • the target information acquisition unit includes: When multiple pieces of target information are acquired from a single source information, the same hierarchical level information is acquired.
  • the target information can be obtained at high speed.
  • the target information acquisition unit searches for one piece of original information when acquiring a plurality of pieces of target information from one piece of original information, Address information
  • the hierarchy level including the location information that is one or more of the information and the postal code is determined, and the information of the determined hierarchy level is acquired.
  • the target information can be obtained accurately and at high speed.
  • objective information such as a store can be appropriately acquired.
  • FIG. 1 is a conceptual diagram of an information processing system in the present embodiment.
  • the information processing system includes an information terminal 11, an information processing device 12, and an information storage device 13.
  • the information terminal 11 is a so-called client terminal, for example, a terminal that outputs target information such as a restaurant.
  • the target information is information about two or more search targets (restaurants, etc.) specified by the search information.
  • the target information to be used is, for example, information related to the evaluation of restaurants, etc. (delicious, fashionable, bad, etc.).
  • the information processing device 12 is a device that acquires target information in response to a request from the information terminal 11 and transmits the target information to the information terminal 11.
  • the information processing device 12 is, for example, a server device of an application service provider equipped with a so-called search engine.
  • the information storage device 13 is a device that stores target information such as a restaurant, for example.
  • the information storage device 13 is, for example, information on evaluations of restaurants and the like described in information portals, target information indicating evaluations of restaurants and the like written by individual users, and information such as diaries recorded by individual users. Is stored.
  • information that contains target information is called source information.
  • the original information is, for example, the so-called WEB home page
  • FIG. 2 is a block diagram of the information processing system in the present embodiment.
  • the information terminal 11 includes a user input reception unit 1101, a request transmission unit 1102, an information reception unit 1103, and an information output unit 1 104.
  • the information processing apparatus 12 includes a reception unit 1201, a target information acquisition unit 1202, and original information An acquisition unit 1203, an output unit 1204, an original information reception unit 1205, an original information storage unit 1206, and an original information storage unit 1207 are provided.
  • the target information acquisition unit 1202 includes a search target information group storage unit 12021, a search target information acquisition unit 12022, and a target information acquisition unit 12023.
  • the output unit 1204 includes ranking determination means 12041, target information output means 12042, summary means 1204, summary information output means 12044, original information output means 12045, and link symbol output means 12046.
  • the summarizing means 12043 includes a word extracting means 120431, a word appearance count calculating means 120432 for each search target, a total word appearance count calculating means 120433, a ratio calculating means 120434, and a word list creating means 120435.
  • the information storage device 13 includes an original information storage unit 1301 and an original information transmission unit 1302.
  • the user input receiving unit 1101 receives search information that is information for specifying two or more search targets from the user.
  • Search targets include, for example, restaurants, English conversation schools, and travel destinations.
  • the search information is information for specifying information desired by the user, which is a so-called search key.
  • Search information includes, for example, search point information that is information about the search point (station name such as Shibuya Station, address, area specified by phone number, etc.) and target group information that is information that specifies the group to be searched (Such as ramen [information to identify ramen restaurants and groups to be searched], Italian restaurants, and Chinese cuisine [information to identify groups to be searched as Chinese restaurants]).
  • the search information may further include, for example, search range information (within 5 minutes on foot, within 1 km, etc.) that is information for specifying the search range of the search point power indicated by the search point information. Further, the search information may include other search keys. Further, the user input receiving unit 1101 also receives a summary information selection instruction that is an instruction for the output summary information. Summary information is information that summarizes the target information. There are various methods for summarizing target information. An example of the target information summarization method will be described later. The user input receiving unit 1101 also receives a link symbol selection instruction that is an instruction for link symbol information. The link symbol information is information corresponding to link information that is information indicating the location of the original information in which the target information is described. A specific example of link symbol information will be described later.
  • the user input receiving unit 1101 receives various instructions and inputs that are user-friendly.
  • the search information input means may be anything such as a numeric keypad, keyboard, mouse or menu screen.
  • Receive user input The attachment unit 1101 can be realized by a device driver for input means such as a numeric keypad or a keyboard, or control software for a menu screen.
  • the request transmission unit 1102 transmits request information having the search information to the information processing device 12 based on the search information received by the user input reception unit 1101.
  • the request information is information indicating a request for acquiring target information to be searched corresponding to the search information.
  • the data structure of request information does not matter.
  • the request information usually includes information for specifying the information processing apparatus 12.
  • the information specifying the information processing apparatus 12 is, for example, a URL or URI indicating a folder included in the target information in the information processing apparatus 12, or an IP address of the information processing apparatus 12.
  • Request transmission unit 1102 usually includes wireless or wired communication means, but may be broadcast means instead of communication means.
  • Information receiving section 1103 receives information such as target information and original information from information processing device 12 based on the transmission of request information in request transmitting section 1102.
  • the information receiving unit 1103 is usually realized by a wireless or wired communication means, but can also be realized by a broadcast receiving means.
  • the information output unit 1104 outputs information such as target information and original information received by the information receiving unit 1103.
  • the output here is a concept that mainly includes display on a display, printing on a printer, and sound output, but transmission to an external device.
  • the information output unit 1104 may or may not include an output device such as a display or a speaker.
  • the information output unit 1104 can be realized by output device driver software, or output device driver software and output device. Note that the processing of the user input reception unit 1101, the request transmission unit 1102, the information reception unit 1103, the information output unit 1104, and the like in the information terminal 11 can be realized by, for example, processing of V or a so-called WEB browser.
  • the accepting unit 1201 accepts an instruction to acquire search information that is information for specifying two or more search targets and other information.
  • the search information is included in the request information.
  • the other information acquisition instruction is, for example, information including a URL.
  • information specified by the URL for example, a home page
  • the reception unit 1201 normally receives request information. “Accept” here usually means reception from the information terminal 11. However, in general, the user It may also include accepting manually entered information and reading the recording medium power.
  • the reception unit 1201 is usually realized by a wireless or wired communication means, but may be realized by a means for receiving a broadcast.
  • the reception unit 1201 can also be realized by a device driver for input means such as a numeric keypad and a keyboard, control software for a menu screen, and the like.
  • the target information acquisition unit 1202 acquires target information that is information regarding two or more search targets specified by the search information received by the reception unit 1201. Two or more information storage devices 13 or the original information storage unit 1207 of the information processing device 12 may be used as the destination for acquiring the target information.
  • the target information acquisition unit 1202 can usually be realized by an MPU, a memory, or the like.
  • the processing procedure of the target information acquisition unit 1202 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the target information acquisition unit 1202 can be realized with a configuration including a wireless or wired communication unit.
  • the source information acquisition unit 1203 links the source information that describes target information that is the basis of the summary target information corresponding to the summary target information selection instruction.
  • the original information is acquired based on the information.
  • the receiving unit 1201 receives the link symbol selection instruction
  • the original information acquisition unit 1203 is based on the link information corresponding to the link symbol information corresponding to the link symbol selection instruction! /
  • the original information which is information in which the target information indicated by is described is acquired.
  • the link information is, for example, a URL or URI indicating the location of the original information.
  • the original information acquisition unit 1203 acquires a homepage corresponding to, for example, a URL or a URI.
  • the original information acquisition unit 1203 can usually also realize an MPU, a memory and the like.
  • the processing procedure of the original information acquisition unit 1203 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the original information acquisition unit 1203 can be realized with a configuration that includes wireless or wired communication means.
  • the output unit 1204 outputs target information of two or more search targets.
  • the output unit 1204 may output two or more pieces of summary target information, which is information obtained by summarizing two or more pieces of search target information.
  • the output unit 1204 has two or more search targets as described below. Information or Z and summary target information may be ranked and output.
  • the output unit 1204 may also output the original information acquired by the original information acquisition unit 1203.
  • the output unit 1204 may also output link symbol information that is information corresponding to the link information.
  • the term “output” is a concept including a display on a force display, printing on a printer, sound output, etc., which are usually transmitted to the information terminal 11.
  • the output unit 1204 is usually realized by software constituting information to be transmitted and wireless or wired communication means, but may be broadcast means instead of the communication means. Further, the output unit 1204 can be realized by driver software of an output device or driver software of an output device and an output device. The output unit 1204 may or may not include an output device.
  • the original information receiving unit 1205 receives original information from the information storage device 13.
  • Original information is information including target information.
  • the original information is, for example, information with layered tags such as HTML, compact HTML (hereinafter referred to as “C-HTML”) or XML.
  • the original information is, for example, a so-called home page.
  • the original information receiving unit 1205 automatically acquires the original information from a large number of information storage devices 13 at a predetermined time.
  • the original information receiving unit 1205 is usually realized by a wireless or wired communication means, but may be realized by a means for receiving a broadcast.
  • the original information accumulation unit 1206 accumulates the original information received by the original information reception unit 1205 in the original information storage unit 1 207.
  • the original information storage unit 1206 can usually be realized by an MPU, a memory, or the like.
  • the processing procedure of the original information storage unit 1206 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the original information storage unit 1207 stores original information.
  • the original information storage unit 1207 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.
  • Search target information group storage means 12021 indicates search target name information that is information indicating a search target name, telephone number information that is information indicating a search target telephone number, and a search target address. Stores a search target information group having one or more search target information having address information as information.
  • the search target information is information indicating a zip code. You may have postal code information.
  • the search target information group is, for example, so-called yellow page information.
  • the search target information group storage unit 12021 is preferably a non-volatile recording medium, but can also be realized by a volatile recording medium.
  • the search target information acquisition unit 12022 acquires part or all of the search target information from the search target information group storage unit 12021 based on the search information.
  • Search target information acquisition means 12022 acquires, for example, a part or all of the search target information having information on the type of business that the search information has (for example, “English conversation school”, “Ramen shop”, etc.).
  • the to-be-searched object information acquisition means 12022 can be usually realized by an MPU, memory, or the like.
  • the processing procedure of the search target information acquisition means 12022 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the target information acquisition means 12023 is an object that is information on two or more search targets specified by the search information based on part or all of the search target information acquired by the search target information acquisition means 12022. Get information.
  • the target information acquisition means 12023 searches for one original information when one original information ability also acquires a plurality of target information, and is a place that is one or more of telephone number information, address information, and postal code.
  • a hierarchy level having a predetermined relationship with a hierarchy level including information is determined, and information on the determined hierarchy level is acquired.
  • the target information acquisition unit 12023 acquires, for example, information on a predetermined block including two or more pieces of information of telephone number information, address information, and zip code information acquired by the search target information acquisition unit 12022.
  • the predetermined lump information may be one paragraph of information, one page of information, or information with a predetermined tag (for example, “ ⁇ tr>”).
  • the target information acquisition means 12023 can usually also be implemented with an MPU or memory power.
  • the processing procedure of the target information acquisition means 12023 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the ranking determining unit 12041 ranks two or more search targets based on the target information of two or more search targets. For example, the ranking determination unit 12041 may rank two or more search targets based on the number of characters of all target information, and based on the number of all target information (the number of articles described). Two or more search targets may be ranked. Rankin The determination means 12041 may determine whether or not ranking is based on the page ranking of the original information in which whether or not the telephone number information is included in the target information of two or more search targets or the target information is described. good. For example, it is assumed that the page ranking of the original information (for example, WEB page) is held in advance. There are various known methods for determining the page ranking of a web page.
  • the known various methods include a method of ranking according to the number of links to other home pages.
  • the page ranking of the WEB page may be determined by a well-known method. Any other algorithm that ranks two or more search targets can be used.
  • the ranking determining unit 12041 can usually be realized by an MPU, a memory, or the like.
  • the processing procedure of the ranking determining means 12041 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the target information output means 12042 outputs the target information of two or more search targets based on the ranking of the ranking determination means 12041.
  • the target information output means 12042 normally configures and outputs information so that information about the search target ranked higher (such as target information, summary information, and search target name) is also presented to the user.
  • the output is usually a transmission to the information terminal 11, but is a concept including display on a display, printing on a printer, sound output, and the like.
  • the summarizing means 12043 summarizes two or more pieces of target information and acquires two or more pieces of summary information.
  • the summarizing means 12043 obtains the first 50 characters of the target information and uses a powerful character string as summary information.
  • the summarizing means 12043 can be usually realized by an MPU, a memory or the like.
  • the processing procedure of the summarizing means 12043 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the summary information output means 12044 outputs two or more pieces of summary information acquired by the summary means 12043.
  • Output is a concept that includes display on a display, printing on a printer, sound output, transmission to an external device, and the like. Here, normally, the output is transmission to the information terminal 11.
  • the summary information output unit 12044 is realized by, for example, a wireless or wired communication unit.
  • the original information output unit 12045 outputs the original information acquired by the original information acquisition unit 1203.
  • Output is a concept that includes display on a display, printing on a printer, sound output, transmission to an external device, and the like. Here, normally, output is transmission to the information terminal 11.
  • the original information output unit 12045 is realized by, for example, a wireless or wired communication unit.
  • Link symbol output means 12046 outputs link symbol information which is information corresponding to link information.
  • Link symbol information is, for example, an image indicating that it is a link source for evaluation information such as restaurants, etc. (Icon) etc.
  • the concept of output is as described above.
  • the link symbol output means 12046 is realized by, for example, a wireless or wired communication means.
  • the word extraction means 120431 extracts words from the target information. There are various algorithms for extracting words. For example, the word extraction unit 120431 holds a dictionary and extracts words registered in the dictionary. Further, the word extraction means 120431 may extract nouns. Since this technique is a well-known language processing technique, detailed description is omitted.
  • the word extraction means 120431 can usually also be implemented with an MPU or memory power.
  • the processing procedure of the word extraction means 120431 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • Word appearance count calculation means 120432 for each search target calculates the number of appearances for each search target in each word extracted by the word extraction means 120431.
  • the word appearance count calculating means 120432 for each search target can usually be realized by an MPU, a memory and the like.
  • the processing procedure of the word appearance count calculating means 120432 for each search target is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • Word total appearance count calculation means 120433 calculates the number of appearances in all target information of all search targets for each word extracted by word extraction means 120431.
  • the word total appearance count calculating means 120433 can usually be realized by an MPU, a memory and the like.
  • the processing procedure of the word total appearance count calculation means 120433 is usually realized by software, and the software It is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the ratio calculation means 120434 is the ratio between the number of appearances for each search target calculated by the word appearance count calculation means 120432 for each search target and the number of appearances in all target information calculated by the word total appearance count calculation means 120433. Is calculated.
  • the ratio calculating means 120434 can be usually realized from MPU memory or the like.
  • the processing procedure of the ratio calculating means 120434 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • the word list creation unit 120435 creates a word list for each search target by arranging words having a high rate calculated by the rate calculation unit 120434.
  • the word list creation means 120435 can usually be implemented with an MPU or memory power.
  • the processing procedure of the word list creation means 120435 is usually realized by software, and the software is recorded on a recording medium such as a ROM. However, it may be realized by hardware (dedicated circuit).
  • each output means held by the output unit 1204 is normally realized physically by one means.
  • the output unit 1204 normally configures one file (for example, a file described in HTML) from information to be output such as summary information and link symbol information, and transmits the file to the information terminal 11. Further, when the output unit 1204 outputs one or more pieces of information of target information, summary information, original information, and link symbol information, the output unit 1204 synthesizes, for example, useful information. Process to configure the file. More specifically, the output unit 1204 is a web page that includes one or more information items of target information, summary information, source information, and link symbol information of two or more search targets (for example, two or more restaurants). Configure and output.
  • the original information storage unit 1301 stores one or more pieces of original information.
  • the original information includes target information to be searched.
  • the original information is a so-called page described in HTML, C HTML, XML, or the like.
  • the original information storage unit 1301 can also be realized by a force volatile recording medium, which is preferably a non-volatile recording medium.
  • the original information transmission unit 1302 transmits the original information in the original information storage unit 1301.
  • the trigger and timing at which the original information transmission unit 1302 transmits the original information is not limited.
  • the original information transmission unit 1302 For example, the original information is transmitted in response to a request from the information processing apparatus 12.
  • the original information transmission unit 1302 is usually realized by a wireless or wired communication means, but may be realized by a broadcasting means.
  • the operation of the information processing system will be described. First, the operation of the information terminal 11 will be described using the flowchart of FIG.
  • Step S301 The user input receiving unit 1101 determines whether or not an input from the user has been received. If an input is accepted, the process goes to step S302. If no input is accepted, the process returns to step S301.
  • Step S302 The user input receiving unit 1101 determines whether or not the input received in step S301 is search information. If it is search information, it goes to step S303, and if it is not search information, it jumps to step S307.
  • Step S303 The request transmission unit 1102 configures request information based on the search information received in step S301.
  • the request information is information for requesting acquisition of target information to be searched.
  • Step S304 The request transmission unit 1102 transmits the information configured in Step S303, Step S308, or Step S310.
  • Step S305 The information receiving unit 1103 determines whether or not the information such as the target information is received from the information processing apparatus 12. If information is received, the process proceeds to step S306, and if information is not received, the process returns to step S305.
  • Step S306 The information output unit 1104 outputs the information received in step S305.
  • the powerful information output unit 1104 interprets a file described in HTML received by the information receiving unit 1103, configures a page, and displays the page on the display. Step S 301 Go back.
  • Step S307 The user input receiving unit 1101 determines whether or not the input received in step S301 is a summary information selection instruction. If summary information selection instruction, step S
  • the request transmission unit 1102 constitutes an information acquisition request including a summary information selection instruction.
  • the constituent information includes link information of the original information in which the target information that is the basis of the summary information corresponding to the summary information selection instruction is described.
  • the link information is, for example, the original information A URL or URI indicating the location of the news. Step S304 Go here.
  • Step S 309 User input reception unit 1101 determines whether or not the input received in step S 301 is a link symbol selection instruction. If it is a link symbol selection instruction, go to step S310, and if it is not a link symbol selection instruction, jump to step S311.
  • Request transmission section 1102 constitutes an information acquisition request including a link symbol selection instruction.
  • the constituent information includes the link information of the original information corresponding to the link symbol selection instruction.
  • the link information is, for example, a URL or URI indicating the location of the original information
  • Step S311 Perform processing according to the accepted input. There are various kinds of processing. Such processing is, for example, processing performed by a so-called WEB browser. Step S301 ⁇ Go back.
  • Step S401 The receiving unit 1201 determines whether or not the information has been received. If the information is accepted, the process goes to step S402. If the information is not accepted, the process returns to step S401.
  • Step S402 Reception unit 1201 determines whether or not the information received in step S401 includes search information. If the search information is included, the process goes to step S403. If the search information is not included, the process jumps to step S406.
  • the case where the search information is included is a case where the request information described above is accepted.
  • Step S403 The target information acquisition unit 1202 acquires target information that is information regarding two or more search targets specified by the search information received in step S401. Details of the target information acquisition processing will be described with reference to the flowchart of FIG.
  • Step S404 The output unit 1204 configures information to be transmitted to the information terminal 11. Details of the transmission information configuration processing will be described with reference to the flowchart of FIG.
  • Step S405 The output unit 1204 outputs the information configured in step S404.
  • the output here is transmission to the information terminal 11. Return to step S401.
  • Step S406 The receiving unit 1201 selects the summary information selected in step S401. It is determined whether it is a selection instruction. If it is a summary information selection instruction, the process goes to step S407, and if it is not a summary information selection instruction, the process jumps to step S408.
  • Step S407 The original information acquisition unit 1203 acquires the original information based on the link information of the original information in which the target information that is the source of the summary target information corresponding to the summary target information selection instruction is described. Go to step S405.
  • Step S 408 Reception unit 1201 determines whether or not the information received in step S 401 is a symbol information selection instruction. If it is a symbol information selection instruction, the process goes to step S408, and if it is not a symbol information selection instruction, the process returns to step S401.
  • Step S409 Based on the link information for the instructed link symbol information, the original information acquisition unit 1203 acquires the original information, which is information describing the target information indicated by the link information. Step S405
  • Step S501 The search target information acquiring means 12022 substitutes 1 for the counter i.
  • Step S502 Search target information acquiring means 12022 determines whether or not the target search information exists for the cell. If the i-th search target information exists, the process proceeds to step S503. If the i-th search target information does not exist, the process jumps to step S506.
  • Step S 503 Search target information acquiring means 12022 determines whether or not the target search information of the cell satisfies the search information requirement. If the search information requirement is satisfied, the process goes to step S504, and if the search information requirement is not satisfied, the process jumps to step S505.
  • search information for example, “about from JR Yamanote Line Shinjuku It ’s OK to judge whether the power matches the ramen shop ”
  • Search target information acquisition means 12022 acquires part or all of the search target information that satisfies the requirements of the search information.
  • a part or all of the information to be searched is a search key.
  • Search target information acquisition means 12022 temporarily stores a search key.
  • Step S505 Search target information acquiring means 12022 increments counter i by one. Return to step S502.
  • Step S506 The search target information acquiring means 12022 substitutes 1 for the counter i.
  • Step S507 The target information acquisition means 12023 determines whether or not the i-th search key exists. If the i-th search key exists, the process goes to step S508. If the i-th search key does not exist, the process returns to the upper function.
  • Step S508 The target information acquisition means 12023 substitutes 1 for the counter j.
  • Step S509 The target information acquisition means 12023 determines whether or not the j-th original information exists in the original information storage unit 1207. If the original information of the cell exists, go to step S510, and if the j-th original information does not exist, jump to step S517.
  • Step S510 The target information acquisition unit 12023 determines whether or not a search target tag corresponding to the i-th search key exists. If the search target tag exists, the process proceeds to step S511, and if the search target tag does not exist, the process jumps to step S518.
  • the initial value of the search target tag corresponding to all search keys is NULL (the search target tag does not exist! ⁇ ).
  • Step S511 The target information acquisition means 12023 substitutes 1 for the counter k.
  • Step S512 The target information acquisition unit 12023 determines whether or not the k th search target tag exists in the j th original information. If the kth search target tag exists, the process goes to step S513, and if the kth search target tag does not exist, the process jumps to step S516.
  • the target information acquisition unit 12023 acquires information corresponding to a powerful search target tag. Such information is a candidate for target information.
  • Step S514 The target information acquisition unit 12023 determines whether or not the information acquired in Step S513 matches the condition indicated by the search key. Step if the condition is met Go to S515 and if the conditions are not met, jump to step S521. Note that whether or not the condition indicated by the search key is met can be determined by various algorithms. For example, if the information acquired in step S513 includes one or more of the two or more pieces of information (for example, store name, address information, telephone number information, and zip code information) that the search key has, the condition is met. You may decide that Further, for example, it may be determined that the condition is met when the store name included in the information-power search key acquired in step S513 is included and a part of the address information is included.
  • the condition indicated by the search key can be determined by various algorithms. For example, if the information acquired in step S513 includes one or more of the two or more pieces of information (for example, store name, address information, telephone number information, and zip code information) that the search key has, the condition is
  • Step S5 The target information acquisition unit 12023 temporarily stores the information acquired in Step S513. Such information is target information.
  • the target information is stored in a pair with the search key or the search target information.
  • Step S509 The target information acquisition means 12023 increments the counter j by 1. Step Return to S509.
  • Step S517) The target information acquisition unit 12023 increments the counter i by 1. Return to step S507.
  • Step S578 The target information acquisition unit 12023 determines whether or not there is a portion where the j-th original information matches the condition indicated by the search key. That is, for example, when the search key has “store name”, “phone number information”, and “address information”, and when the search key includes two or more pieces of information among “store name”, “phone number information”, and “address information”, It is assumed that the relevant part meets the condition. In addition, various algorithms can be considered for determining whether or not the j-th original information has a force that matches the condition indicated by the search key.
  • Step S519 The target information acquisition unit 12023 acquires a tag corresponding to a location that matches the condition indicated by the search key.
  • Step S520 The target information acquisition unit 12023 registers the tag acquired in step S519 as a search tag corresponding to the jth original information.
  • registration means writing to a memory or a predetermined buffer. Go to step S515.
  • Step S521 The target information acquisition unit 12023 increments the counter k by 1. Return to step S512.
  • the target information acquisition unit 12023 has the tag structure of the original information.
  • processing to acquire information at the same hierarchical level was performed.
  • the processing in this flowchart is an example of processing for acquiring information of the same hierarchical level when a plurality of pieces of target information are acquired from one original information.
  • the target information acquisition unit 12023 constructs a tag structure tree of original information, and includes two or more pieces of location information (address information, telephone number information, postal code information, etc.) in the structure tree. May be registered as a search tag.
  • a tag including two or more location information is registered as a search tag.
  • a tag including one or more location information may be registered as a search tag, or a tag including three or more location information. May be registered as a search tag.
  • the target information acquisition means 12023 is not limited to the processing procedure or the like as long as the process of acquiring the same hierarchical level information is performed when the same original information ability also acquires a plurality of target information. Yes.
  • Step S601 The ranking determining unit 12041 ranks two or more search targets based on the target information of two or more search targets. Details of the ranking process, which is a powerful ranking process, will be described with reference to the flowchart of FIG.
  • Step S602 The target information output means 12042 substitutes 1 for the counter i.
  • the target information output means 12042 constitutes the header of the i-th target information.
  • the target information output means 12042 constitutes the header of the i-th target information.
  • Step S604 The target information output means 12042 substitutes 1 for the counter j.
  • Link symbol output means 12046 constitutes j-th link symbol information.
  • link information indicating the location of the original information is used. This is because the original information acquisition unit 1203 uses the link information to access the original information when the link symbol information is pressed.
  • Step S606 Summarization means 12043 acquires summary information. Details of the summary information acquisition process, which is a process for acquiring summary information, will be explained using the flowchart of FIG. Light up.
  • the target information output means 12042 constitutes a summarizing section using one or more pieces of summary information.
  • the summary unit is information that constitutes information to be output.
  • the summary section uses the summary information of the summary section and link information of the original information from which the summary information is composed. This is because when the summary information is pressed, the original information acquisition unit 1203 accesses the original information using the link information.
  • Step S608 The counter j is incremented by one.
  • Step S609 The target information output means 12042 determines whether or not the processing of all the link symbol information and summary information of the i-th search target has been completed (whether or not j is the last). Such a determination may be made when processing of the previously extracted summary information is completed, or may be made when processing of a predetermined number of summary information is completed. If j is the last, go to step S610, and if j is not the last, return to step S605.
  • Step S610 The target information output means 12042 increments the counter i by 1.
  • Step S611 The target information output means 12042 determines whether or not the i-th search target exists. If the i-th search target exists, the process goes to step S612. If the i-th search target does not exist, the process jumps to step S603.
  • the target information output unit 12042 constitutes information to be output.
  • Such processing is, for example, recording a tag such as “ku ZHTML>” in the HTML file in the last line of the file. That is, it is post-processing for configuring information to be transmitted. Return to upper function.
  • Step S701 The ranking determining means 12041 substitutes 1 for the counter i.
  • Step S702 The ranking determining unit 12041 determines whether or not the i-th search target exists. If the i-th search target exists, the process goes to step S703. If the i-th search target does not exist, the process jumps to step S713.
  • Step S703 The ranking determining unit 12041 substitutes 0 for the point information of the i-th search target. Point information is information used to determine ranking.
  • Step S704 The ranking determining means 12041 substitutes 1 for the counter j.
  • Step S705 The ranking determining unit 12041 determines whether or not the j th target information exists in the i th search target. If the j-th target information exists, the process proceeds to step S706. If the j-th target information does not exist, the process jumps to step S714.
  • the ranking determining unit 12041 obtains the data amount of the j-th target information.
  • the amount of data may be the number of characters, the number of bytes (data length), the number of words, the number of sentences, etc.
  • Step S707 The ranking determining unit 12041 acquires the page rank of the original information of the j-th target information. For example, it is assumed that the information processing apparatus 12 holds the page rank of the original information in advance corresponding to the original information.
  • Step S708 The ranking determining unit 12041 determines whether or not the i-th search target telephone number information is included in the j-th target information. If the telephone number information is included, the process goes to step S709. If the telephone number information is not included, the process jumps to step S715.
  • the ranking determining means 12041 substitutes ON for the telephone number flag.
  • the telephone number flag is a flag indicating whether or not the i-th search target telephone number information is included.
  • Step S710 The ranking determination means 12041 calculates points based on the data amount acquired in Step S706, the page rank of the original information acquired in Step S707, and one or more information in the telephone number flag. calculate. An example of a specific point calculation algorithm will be described later.
  • Step S711 The ranking determining unit 12041 adds the point calculated in Step S710 to the point information of the i-th search target.
  • Step S712 The ranking determining means 12041 increments the counter j by 1. Go to step S705.
  • Step S713 The ranking determining unit 12041 sorts the search targets using the point information as a key. Return to upper function.
  • Step S714 The ranking determining unit 12041 increments the counter i by 1. Go to step S702. (Step S715) The ranking determining means 12041 substitutes OFF for the telephone number flag. Go to step S710.
  • the ranking determination means 12041 describes the number of characters of target information of two or more search targets, whether the target information includes telephone number information, and the target information! Based on the information page ranking !, more than two search targets were ranked. However, the ranking determining unit 12041 ranks two or more search targets based on the number of characters of the target information of two or more search targets, whether or not the phone number information is included, and one or more pieces of information in the page ranking. May be attached. Further, the ranking determination means 12041 may rank two or more search targets based on other information such as the number of articles to be searched two or more.
  • Step S801 Summarizing means 12043 substitutes 1 for counter i.
  • Step S802 The summarizing means 12043 determines whether or not the i-th search target exists. If the i-th search target exists, the process goes to step S803. If the i-th search target does not exist, the process returns to the upper function.
  • Step S803 The word extracting means 120431 substitutes 1 for the counters j and k.
  • Step S804 The word extracting means 120431 extracts the kth word from the jth target information.
  • Word appearance count calculating means 120432 for each search target calculates the number of appearances of the word extracted in step S804 (first appearance count) in all target information of the i-th search target.
  • Step S806 The word total appearance count calculating means 120433 calculates the number of appearances (second appearance count) of the word extracted in step S804 in all the target information of all search targets.
  • Step S807 The ratio calculating means 120434 calculates the ratio of the first appearance count to the second appearance count.
  • Step S808 The word list creation means 120435 uses the words extracted in Step S804 And register (temporarily store) a pair of information calculated in step S807.
  • Step S809 The word extracting means 120431 increments the counter k by 1.
  • Step S810 The word extraction means 120431 determines whether or not the kth word exists from the jth target information. This kth word is a word that has not been processed so far. If the kth word exists, go to step S804, and if the kth word does not exist, go to step S811.
  • Step S811 The counter j is incremented by one.
  • Step S812 The word list creation means 120435 determines whether or not the j-th target information of the i-th search target exists. If the j-th target information exists, the process goes to step S804. If the j-th target information does not exist, the process goes to step S813.
  • the word list creation means 120435 sorts the words based on the ratio information. For example, consider that the word at the top of the sort is a word that is unique to the search target.
  • Step S814 The summarizing means 12043 substitutes 1 for the counter m.
  • Step S815 The summarizing means 12043 determines whether or not the i-th search target summary information is larger than a predetermined size. Note that the initial value of the summary information for each search target is NULL. If larger than the predetermined size, go to step S818, and if smaller than the predetermined size, go to step S816.
  • Step S816 The summarizing means 12043 acquires the sentence containing the mth word from all the target information of the i-th search target and adds it as summary information.
  • Step S817) The summarizing means 12043 increments the counter m by 1.
  • Step S818) The summarizing means 12043 works so that the summary information is within a predetermined size. Cut is a process of erasing information beyond a predetermined size.
  • Step S819) Summarizing means 12043 increments counter i by 1. Go to step S8 02.
  • the flowchart of FIG. 8 shows an algorithm for acquiring summary information by paying attention to a word that is a characteristic of a search target.
  • the summarizing means 12043 includes a word extracting means for extracting words from the target information, and a search for each word extracted by the word extracting means. What is necessary is just to have a word appearance count calculation means for each search target for calculating the appearance count for each target and a summary acquisition means for acquiring summary information for each search target from the target information based on the appearance count. In other words, it is not always necessary to construct the word list based on the ratio of the first appearance count to the second appearance count.
  • Another algorithm is, for example, the following algorithm. Take one sentence at a time from the “collection of sentences included in all target information of the i-th search target” and score by the score and ratio of the characteristic words contained in the sentence. For example, if you say “special gyoza is recommended”, “special” is the 5th characteristic word (4.6 points) and “gyoza” is the 3rd characteristic word (5.0 points). 6 / word count. On the other hand, “This restaurant recommends dumplings using special black pork!”! Ubun also includes “special” and “gyoza,” but the number of words is so large. Lower score. However, if “Black Pig” is the first feature word and the points are high enough, this sentence will be preferentially selected.
  • the feature word is a word specific to the search target, and the point is information indicating the degree of peculiarity of the search target of the word.
  • the number of appearances is a concept including the concept of the above points and the concept of the appearance degree of other words. That is, the summary acquisition means is configured to acquire the summary information of each search target based on the number of appearances.
  • FIG. 1 A conceptual diagram of the information processing system is shown in FIG. 1
  • the information terminal 11 is, for example, a personal computer equipped with a WEB browser.
  • the information terminal 11 is a terminal that outputs target information such as a ramen shop, for example.
  • the information processing device 12 is, for example, a server device equipped with a so-called search engine.
  • the information storage device 13 is, for example, a server device that stores a homepage of a ramen shop.
  • the home page is described in, for example, HTML.
  • FIG. 9 shows an example of a homepage received by the information processing apparatus 12 from a large number of information storage apparatuses 13.
  • a powerful homepage corresponds to the original information described above.
  • the original information receiving unit 1205 receives the home page from the information storage device 13, and the original information accumulating unit 1206 accumulates the home page received by the original information receiving unit 1205 in the original information storing unit 1207.
  • Originality The information storage unit 1207 stores a large number of homepages.
  • FIG. 10 shows a search target information group stored in the search target information group storage unit 12021.
  • the search target information group includes “search target name information”, “zip code information”, “address information”, and “phone number information”.
  • Search target name information is, for example, a store name.
  • the search target information group is, for example, a so-called yellow page.
  • FIG. 11 is an information portal management table.
  • the information portal management table is highly reliable and manages the HP URL of the information portal.
  • the homepage identified by the URL managed in the powerful information portal management table is a homepage with a high page rank.
  • a home page not managed by the information portal management table is a home page with a low page rank.
  • the page rank information is used by the ranking determining means 12041.
  • the user inputs the home page URL of the information processing apparatus 12 from the information terminal 11 and accesses the home page.
  • the information terminal 11 has received and displayed a homepage for searching for a restaurant.
  • the user enters search information in a field on the homepage in order to obtain information on the restaurant (in this case, ramen shop) that he / she wants to search (see FIG. 12).
  • the search information includes information indicating “search point”, information indicating “range”, and “keyword”.
  • the user presses the “Search” button after inputting the search information.
  • the user searches for a ramen shop in the JR Yamanote Line Shinjuku Riki within about 10 minutes walking distance.
  • the request transmission unit 1102 of the information terminal 11 configures request information (see FIG. 13) having the search point “JR Yamanote Line Shinjuku”, the range “about 10 minutes walk”, and the keyword “ramen”.
  • the request information is transmitted to the information processing apparatus 12.
  • “1” in the request information in FIG. 13 is a search flag for instructing a search.
  • the request information name “1” indicates that the name is not a search key.
  • the receiving unit 1201 of the information processing apparatus 12 receives request information from the information terminal 11.
  • the request information includes search information that is information for specifying two or more search targets.
  • the search target information acquisition means 12022 stores the search target information group based on the received search information (search point “JR Yamanote Line Shinjuku”, range “about 10 minutes walk”, keyword “ramen”). Part or all of the search target information is acquired from step 12021. Specifically, the search target information acquisition means 12022 calculates a distance of about 10 minutes on foot from the JR Yamanote Line Shinjuku Riki. In this case, for example, the search target information acquisition means 12022 calculates a ramen shop within 800 m of the JR Yamanote Line Shinjuku as one minute on foot from the search target information group in FIG.
  • Search target information acquisition means 12022 holds addresses of a number of search points such as JR Yamanote Line Shinjuku, and holds map information for converting addresses to latitude and longitude. Then, the search target information acquisition means 12022 acquires location information (latitude and longitude) of the JR Yamanote Line Shinjuku from the location of the JR Yamanote Line Shinjuku. Next, the search target information acquisition unit 12022 acquires position information (latitude and longitude) from the address information of the search target information group in FIG. Then, the search target information acquisition means 12022 calculates the distance between the location information of the JR Yamanote Line Shinjuku and the location information of the store to be searched, and determines whether it is within 800 m.
  • the search target information acquisition means 12022 acquires records of stores within 800 m from the search target information group in FIG. Next, the search target information acquisition unit 12022 acquires a record including the character string “ramen” in the “search target name information” from the acquired records. And some or all of the powerful records are the search target information. In addition, the search flow of search target information is not ask
  • the search target information intermediate table is a set of records indicating search targets.
  • the target information acquisition unit 12023 searches the original information storage unit 1207 based on the searched target information intermediate table of FIG. 14 acquired by the searched target information acquisition unit 12022, and acquires the target information.
  • the target information is information about the store specified by each record in the searched target information intermediate table in FIG.
  • the target information acquisition means 12023 first performs the test. Search the information described for “Kumamoto OO Ramen” in the first record of the search target information intermediate table for all websites in the original information storage unit 1207 as well. This search is performed using the following algorithm.
  • the homepage is described here as data hierarchized by tags such as HTML and XML.
  • the homepage is described in HTML.
  • the target information acquisition unit 12023 constructs an HTML structural tree from the home page.
  • the HTML structure tree is information indicating the hierarchical relationship of HTML tags as shown in FIG. 15, for example.
  • Figure 15 shows that the tr> tag exists under the ⁇ table> tag and the td> tag exists under the ⁇ tr> tag.
  • the ⁇ table> tag is a tag that specifies the entire table
  • the ⁇ tr> tag is a tag that specifies a row (record) in the table.
  • the ⁇ td> tag is a tag that designates a cell. The reason for this powerful process is that the information of each store is very often described in the same hierarchy on the HT ML tag hierarchy.
  • the target information acquisition means 12023 searches the homepage for the address information "Shinjuku-ku, Tokyo ", phone number information "03-1122-3456" Among them, a sentence group including one or more pieces of information is acquired. A sentence group is information surrounded by tags and is target information. Then, the target information acquisition means 12023 adds a tag of a hierarchy including one or more information out of the residence information “Shinjuku-ku, Tokyo...” of “Kumamoto 00 ramen” and the telephone number information “03-1122-3456”. get. Here, it is assumed that the target information acquisition means 12023 detects that there is a tag including the address information “Shinjuku-ku, Tokyo” in the tag (1> tag).
  • the target information acquisition means 12023 selects a tag having two or more location descriptions (such as location information) as the target information. It may be an algorithm determined as an existing tag, and the target information acquisition means 12023 temporarily stores the acquired target information.
  • the target information is stored in one or more location information (address information, telephone number information, zip code). The reason why the text group includes information, etc.) is that information such as stores often includes one or more pieces of location information.
  • the target information acquisition means 12023 searches the following homepage, and addresses information of "Kumamoto OO ramen”"Shinjuku-ku, Tokyo ", phone number information "03-1122-3456" No In other words, the target information including one or more information and the tag of the hierarchy where the target information exists are acquired.
  • the target information acquisition means 12023 has one or more of the address information “Shinjuku-ku, Tokyo...” and telephone number information “03-1122-3456” on the homepage. If there is no sentence group including, the process proceeds to the search process for the next home page.
  • the target information acquisition means 12023 is able to display the address information “Shinjuku-ku, Tokyo...” and telephone number information “03—1122-3456” of “Kumamoto ⁇ Ramen” from all websites. Get target information including one or more information (location information).
  • the above processing is also performed for the second store "Ramen ABC” and the third store “Ramen XYZ", and all target information is temporarily stored.
  • the tag stores information is extracted when the target information search processing of the first store information “Kumamoto 00 ramen” is performed. Search for information that corresponds to the tag (which may be present) and not search for information that corresponds to other tags. Can be removed.
  • the acquisition speed of the target information is increased.
  • First, for each source information an HTML structure tree is constructed, a tag including two or more location information is registered as a search target tag, and only information corresponding to the registered tag may be used as a target information candidate. good.
  • the target information management table shown in FIG. 16 is obtained.
  • the target information acquisition means 12023 searches all home pages in the original information storage unit 1207 and searches for target information of ID “1” to “n”, which is target information of “Kumamoto OO Ramen”. I got it.
  • the target information acquisition unit 12023 acquires target information of ID “n + l” to “n + m”, which is target information of “ramen ABC”.
  • the target information acquisition unit 12023 similarly acquires target information of ID “n + m + 1” to “n + m + p”, which is target information of “ramen XYZ”.
  • the ranking determining unit 12041 obtains the attribute value of the “original information URL” of the record of ID “1” in the target information management table of FIG. 16, and the URL that is the attribute value is the information portal management of FIG. Determine whether it exists in the table. For example, the source information URL “http: ZZwww.gourmet.co.jp” with ID “1” in the target information management table in FIG. 16 exists in the information portal management table in FIG. And Next, the ranking determining unit 12041 determines whether or not the “target information” of the record of ID “1” in the target information management table of FIG.
  • Ranking determining means 12041 sets an attribute value “telephone number” in a ranking intermediate table, which will be described later, as “1” if the telephone number information is included and “0” otherwise. Next, the ranking determining means 12041 counts the number of characters of “target information” in the record with ID “1” in the target information management table of FIG. 16 to obtain “384”. Ranking determining means 12041 forms a ranking intermediate table having one or more records having “ID”, “search target name information”, “page rank”, “phone number”, and “number of characters”. Fig. 17 shows a powerful ranking intermediate table. As a result of the above processing, the record with ID “1” in FIG. 17 is configured.
  • the ranking determining means 12041 obtains the attribute value of “original information URL” of the record of ID “2” in the target information management table of FIG. 16, and the URL that is the attribute value is the information of FIG. Judge whether it exists in the portal management table.
  • the ranking determining means 12041 sets the telephone number “1” because it includes the telephone number information in the “target information” of the record of ID “2” in the target information management table of FIG.
  • the ranking determination unit 12041 counts the number of characters of “target information” in the record with ID “2” in the target information management table of FIG. 16 to obtain “129”.
  • the ranking determining unit 12041 performs the above processing on the records after the ID “3” in the target information management table of FIG. 16 to obtain the ranking intermediate table of FIG.
  • the ranking determining unit 12041 calculates points for each store (search target name information) based on the ranking intermediate table of FIG. That is, the ranking determining means 12041 sets the multiple to “1” when the page rank is “high”, sets the multiple to “0.3” when the page rank is “low”, and sets the multiple when the page number is “1”. If the phone number is “0”, the multiple is “0.5”. Ranking determining means 12041 then multiplies “number of characters” by a multiple of the page rank and a multiple of the telephone number to calculate points. And the ranking determining means 12041 Let the points be rounded to an integer.
  • the ranking determination means 12041 determines the point of "Kumamoto OO Ramen” as "3
  • the ranking determining means 12041 calculates the points of “ramen ABC” and “ramen ⁇ ⁇ ”. As a result, it is assumed that the ranking determining means 12041 calculates the point “2522” for “Kumamoto 00 ramen”, the point “1529” for “ramen ABC”, and the point “4211” for “ramen XYZ”. There are various point calculation algorithms, and it goes without saying that points may be calculated using other calculation formulas. However, in calculating points, it is preferable to consider the page rank and presence / absence of a telephone number. This is because evaluations that take into account the reliability of the website are possible.
  • the summarizing means 12043 reads all target information (target information from ID “1” to ID “n” in FIG. 16) of the first search target “Kumamoto 00 ramen”.
  • the word extraction means 120431 extracts a word (noun) “salt ramen” and the like from all target information.
  • the word appearance count calculating means 1204 32 for each search target calculates the appearance count (first appearance count) of the word (noun) “salt ramen” in all target information of the search target “Kumamoto 00 ramen”. For example, “10” is calculated.
  • the number of first appearances of other words is also calculated by the same process.
  • the summarizing means 12043 reads all target information (target information from ID “n + 1” to “n + m” in FIG. 16) of the second search target “ramen ABC”.
  • the word extraction means 120 431 extracts a word (noun) “special made shrimp ramen” or the like from all target information.
  • the word appearance count calculating means 120432 for each search target calculates the number of appearances (first appearance count) of the word (noun) “special shrimp ramen” in all target information of the search target “ramen ABC”, for example, “ 8 ”is calculated.
  • the number of first appearances of other words is also calculated by the same process.
  • the word total appearance count calculating means 120433 calculates the number of appearances (second appearance count) of all the search target information for words such as “salt ramen” and “special shrimp ramen”. calculate.
  • the ratio calculating means 120434 then divides the first appearance count and the second appearance count. The ratio information is calculated.
  • the word list creation means 120435 sorts the words for each search target using the “ratio” as a key. Then, the summarizing means 12043 obtains the word list management table of FIG.
  • the word list management table holds one or more records having “search target name information”, “word”, “first appearance count”, “second appearance count”, and “ratio”.
  • the summarizing means 12043 collects sentences in the target information power of FIG. 16 until the text in the target information including words with a large ratio reaches a predetermined size (for example, 512 bytes). To get. At that time, the summarizing means 12043 also acquires the original information UR L corresponding to the target information. Then, the summarizing means 12043 obtains the summary information management table shown in FIG.
  • the summary information management table is a record having “search target name information”, “summary information”, and “original information URL”. “Summary information” is extracted from the target information up to a predetermined size of sentences in which a high percentage of words indicating the characteristics of the store appear.
  • the target information output means 12042 configures information to be output by the following processing using the summary information obtained by the above processing.
  • An example of the information that the target information output means 12042 finally configures is shown in FIG.
  • the target information output means 12042 constitutes information of the headline “Ramen XYZ” ranked first.
  • the information in this heading may be anything as long as it indicates that the ranking is first.
  • the heading information includes the number “1” indicating the first ranking, the name information to be searched (store name), and the number of stars rounded up (the star power is higher than the point “4211”).
  • the target information output means 12042 constitutes link symbol information.
  • the link symbol information is information such as “Evaluation 1” and “Evaluation 2” immediately below the heading information of “Ramen ⁇ ”.
  • the information such as “evaluation 1” is an anchor, and holds a URL indicating the location of the original information of the first target information.
  • the target information output means 12042 constructs a character string of “evaluation 1” from the summary information “Gomala Men's ⁇ .” Of the ramen ⁇ in the summary information management table of FIG. “http: ZZwww.Gurme.co.jp” is given to “Evaluation 1” as anchor information.
  • the structure of the character string “evaluation 1” is generated by combining the order (number) of summary information with the fixed character “evaluation”. Then, the configuration of the information in the area (1) in FIG. 20 is completed.
  • the target information output means 12042 adds the summary information acquired by the summarization means 12043 below the area (1) in FIG.
  • the summary information is also an anchor, and a URL indicating the location of the original information corresponding to the target information to be summarized is given to the summary information.
  • the target information output means 12042 obtains the area (2) in FIG. (2) in Fig. 20 is the summary section described above.
  • FIG. 20 shows a display image, which is actually described in HTML.
  • the output unit 1204 transmits the configured information (information in FIG. 20) to the information terminal 11.
  • the information terminal 11 receives the information of FIG. 20 (information described in HTML), interprets and executes the information, and displays the screen of FIG.
  • the information terminal 11 searches the information processing device 12 for a page corresponding to the URL “http: ZZwww.gourmet.co.jp” corresponding to “evaluation 1” of the ramen XYZ, and rhttp: // www. Display the page corresponding to “Gourmet. Co.jp”. Since this process is a process according to a known technique, a detailed description thereof is omitted.
  • the information terminal 11 searches the information processing apparatus 12 for a page corresponding to the URL “http: ZZwww.gourmet.co.jp” corresponding to the summary information “Gomaramen no Uta.” , / www.Gnoreme.co.jp "is displayed.
  • the detailed process is also a process according to a known technique, and detailed description thereof is omitted.
  • objective information such as a store can be appropriately acquired. Specifically, it is possible to search for stores that match the user's behavior (such as a 10-minute walk) from the target location (for example, JR Yamanote Line Shinjuku). In addition, it is possible to search for stores with high accuracy by narrowing down stores using the so-called town page information. In addition, when searching for information such as HTML files and other information such as stores, the probability of extracting unnecessary information can be reduced by dividing and searching for information based on the tag structure. Moreover, necessary information can be acquired at high speed.
  • the hierarchy level that has a predetermined relationship with the hierarchy level including location information that is one or more of the talk number information, address information, and postal code, and acquiring the information of the determined hierarchy level.
  • the probability of retrieving information can be reduced. Specifically, this process can prevent obtaining information that is not information that the user wants to search, such as advertisement information on a WEB page, and obtain good search results.
  • the summarizing means includes a word extracting means for extracting words from the target information, and a search target for calculating the number of appearances for each search target in each word extracted by the word extracting means.
  • Each word appearance count calculation means and a summary acquisition means for acquiring a summary of each search target from the target information based on the appearance count.
  • the summarization means may be processing that only cuts out the beginning of the target information, for example, 100 characters. However, it is possible to obtain summary information that clearly represents the characteristics of the search target such as a store by the summarization method that takes into account the number of occurrences of the word.
  • the output unit 1204 may simply output summary information that is not an anchor.
  • link symbol output means 12046 outputs link symbol information ("evaluation 1", “evaluation 2”, etc.), but link symbol output means 12046 is not essential. In other words, it is not essential to output link symbol information (such as “Evaluation 1” and “Evaluation 2”).
  • a ranking deciding method for ranking two or more search targets. Step 12041 is not essential. That is, store information may be output in the order of processing without ranking.
  • the ranking determination means 12041 includes the number of characters of the target information to be searched for two or more, or Z and whether the target information includes telephone number information or whether the Z and the target information are Two or more search targets are ranked based on the page ranking of the original information. However, you may rank other than this process. For example, the ranking determination unit 12041 may rank two or more search targets based only on the number of home pages on which two or more search targets are described.
  • the search information includes search point information that is information related to the search point and target group information that is information for specifying a search target group.
  • the target group information is a keyword “ramen” or the like.
  • the search information may be only the search point information, or may include other information (such as store size and business hours information).
  • the search target is mainly a dining place (restaurant) such as a ramen shop, but it may be anything such as an English conversation school or a bookstore, a store selling or renting services or goods.
  • the original information that is the information from which the target information is acquired is information with a hierarchical tag
  • the target information acquisition unit When acquiring multiple pieces of target information from the original information, the same hierarchical level information was acquired.
  • the target information acquisition unit may search the target information by a simple search process or the like without using the tag hierarchy information. Needless to say, when the target information is searched using the hierarchical information of the tag, the search process is accelerated.
  • the target information acquisition unit searches for one original information and acquires one of the telephone number information, address information, and zip code when acquiring a plurality of target information from one original information.
  • the hierarchy level that is the same as the hierarchy level including the location information that is one or more pieces of information is determined, and information on the determined hierarchy level is acquired.
  • the target information acquisition unit searches for one source information, and is a place that is one or more of telephone number information, address information, and postal code.
  • Hierarchy level containing information and predetermined It is also possible to determine a hierarchy level having the relationship of and to obtain information on the determined hierarchy level. For example, as shown in Fig.
  • the home page having the tag structure of FIG. 21 (a) includes information desired by the user, such as a restaurant, in each row of the table as shown in FIG. 21 (b). Also, for example, a telephone number is included as an attribute value in each row of the table, and an address is included as another attribute value.
  • the homepage having the tag structure of FIG. 22 (a) includes information desired by the user such as a restaurant in the table record as shown in FIG. 22 (b). That is, the above-described “hierarchy level having a predetermined relationship with the hierarchy level including the location information” may be the same hierarchy level as the “hierarchy level including the location information” or one of the “hierarchy levels including the location information”. It may be the level of the upper hierarchy or the level of the upper hierarchy.
  • the source information may be other information that was the homepage of the WEB, of course.
  • the processing in the present embodiment may be realized by software. And this software may be distributed by software download etc. Also, this software may be recorded on a recording medium such as a CD-ROM and distributed.
  • the software that realizes the information processing apparatus according to the present embodiment is the following program.
  • the program includes a reception step of receiving search information, which is information for specifying two or more search targets, and two or more information that is information regarding two or more search targets specified by the search information. It is a program for executing a target information acquisition step for acquiring two or more original information powers of target information and an output step for outputting the target information of the two or more search targets.
  • the output step summarizes the two or more pieces of target information, obtains two or more pieces of summary information, and summary information that outputs the two or more pieces of summary information.
  • An information output step may be provided.
  • the summarization step includes a word extraction step for extracting a word from the target information, and a word appearance count for each search target for calculating an appearance count for each search target in each word extracted in the word extraction step.
  • a summary acquisition step of acquiring summary information of each search target from the target information based on the step and the number of appearances may be provided.
  • the summarizing step includes a word total appearance count calculating step for calculating the number of appearances in all target information of all search targets for each word extracted in the word extracting step, and the calculation of the word appearance count for each search target.
  • a ratio calculation step for calculating a ratio between the number of appearances for each search target calculated in the step and the number of appearances in all the target information calculated in the word total appearance count calculation step, and a ratio calculated in the ratio calculation step A word list creation step of creating a word list for each search target, arranged from words with a high search rate, wherein the summary acquisition step is based on the word list for each search target, and based on the word list for each search target, Summary information may be acquired.
  • the target information acquisition step link information that is information indicating the location of the information in which the target information is described is also acquired, and in the reception step, a summary information selection instruction that is an instruction to the summary information is issued. And when the summary information selection instruction is received in the reception step, based on the link information of the original information in which the target information that is the basis of the summary information corresponding to the summary information selection instruction is described, An original information acquisition step of acquiring the original information may be further executed, and the output step may include an original information output step of outputting the original information acquired in the original information acquisition step.
  • link information which is information indicating a location of the information in which the target information is described is also acquired, and the output step includes the link information.
  • a link symbol output step for outputting link symbol information that is corresponding information is further provided, and the receiving step also receives a link symbol selection instruction that is an instruction for the link symbol information.
  • the output step further includes a ranking determination step of ranking the two or more search targets based on the target information of the two or more search targets, and based on the ranking of the ranking determination step. Accordingly, the target information or Z and summary information of the two or more search targets may be output.
  • the number of characters of the target information of the two or more search targets or / and whether or not the target information includes telephone number information or / and the target information are described. Based on the page ranking of the original information, you can rank the two or more search targets.
  • the search information preferably includes search point information that is information about a search point and target group information that is information for specifying a search target group.
  • search target name information that is information indicating the name of the search target
  • telephone number information that is information indicating the telephone number of the search target
  • address information that is information indicating the address of the search target.
  • a search target information group having at least one search target information is stored, and in the target information acquisition step, part or all of the search target information is acquired based on the search information. Based on the step and part or all of the search target information acquired in the search target information acquisition step, target information that is information on two or more search target targets specified by the search information is acquired.
  • a target information acquisition step may be provided.
  • the search information further includes search range information that is information for specifying a search range of the search point force indicated by the search point information
  • the search target information acquisition step includes a search point included in the search information. Based on the information, the address information of the search target, and the search range information, one or more search target information may be selected, and a part or all of the selected search target information may be acquired. .
  • the search target information acquisition step the longitude and latitude of the search point information included in the search information and the longitude and latitude of the address information of the search target are acquired, and the two latitudes The distance between the search point indicated by the search point information and the search target point indicated by the address information is calculated, and the condition indicated by the search range information is met based on the distance. By determining whether or not, one or more pieces of search target information may be selected, and a part or all of the selected search target information may be acquired.
  • the original information which is the information from which the target information is acquired, is information with a layered tag.
  • the target information acquisition step a plurality of target information is obtained from one source information. It is preferable to acquire information of the same hierarchical level when acquiring
  • the target information acquisition step when a plurality of pieces of target information are acquired from one source information, one source information is searched and one or more of telephone number information, address information, and postal code are searched. It is also possible to determine a hierarchy level including location information, which is the information of the information, and obtain information on the determined hierarchy level.
  • a hierarchy level including two or more location information may be determined, and the information of the determined hierarchy level may be acquired.
  • the transmission step for transmitting information and the reception step for receiving information are performed by hardware, for example, a modem or an interface card in the transmission step. Does not include processing (processing that can only be done with software)! /.
  • each process may be realized by centralized processing by a single device (system), or may be distributedly processed by a plurality of devices. It may be realized by doing.
  • the processing method described above may be realized by one or more devices.
  • the information processing apparatus 12 may not hold the search target information group storage unit 12021, and another apparatus may hold the search target information group storage unit 12021. In such a case, the information processing device 12 searches for the other device and acquires the search target information.
  • the information terminal 11 and the information processing device 12 may be realized by a single device.
  • the information processing apparatus 12 holds the user input receiving unit 1101, and the output unit 1204 performs processing such as displaying information on a display or outputting sound through a speaker.
  • two or more communication means may be physically realized by a single medium.
  • the present invention can be variously modified without being limited to the above-described embodiments, and it goes without saying that these are also included in the scope of the present invention.
  • the information processing apparatus has an effect that objective information such as a store can be output appropriately, and is useful as, for example, a server apparatus having a search engine on the WEB. .
  • FIG. 3 is a flowchart for explaining the operation of the information terminal.
  • FIG. 4 is a flowchart for explaining the operation of the information processing apparatus.
  • FIG. 5 is a flowchart for explaining the target information acquisition process.
  • FIG. 6 is a flowchart for explaining the transmission information configuration process.
  • FIG. 7 is a flowchart for explaining the ranking process.
  • FIG. 8 is a flowchart for explaining the summary information acquisition process.
  • FIG.10 A diagram showing a group of information to be searched
  • FIG.14 A diagram showing the interim search target information intermediate table
  • FIG. 20 is a diagram showing an example of information to be output [Figure 21] Diagram showing the same HTML structure tree

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】従来の検索エンジンは、2以上のホームページから2以上のユーザが記載した情報を抽出して、多数のユーザの評価に基づいてレストラン等の情報を出力するものではなかった。 【解決手段】2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、前記検索情報により特定される2以上の検索対象の評価に関する情報である2以上の対象情報を2以上の元情報から取得する対象情報取得部と、前記2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置であり、かかる情報処理装置により多数のホームページ等の元情報から、店舗等の検索対象の評価に関する情報を収集できる情報処理装置を提供できる。

Description

明 細 書
情報処理装置およびプログラム
技術分野
[0001] 本発明は、例えば、 WEB上のホームページ等に記載されている店舗の対象情報 を効率的に検索する情報処理装置やプログラム等に関するものである。
背景技術
[0002] 従来の第一の技術として、以下の技術がある。つまり、インターネット上に存在する 大量の Webページから、属性に関する条件とハイパーリンクに関する条件を組み合 わせて指定し、 Webページの系列を検索するための問い合わせの処理方法におい て、 Webページに関するインデックスを利用し、問い合わせに指定された条件から、 未処理で、かつ他条件の処理結果に依存せずに処理結果を求めることのできる条件 の処理コストと処理結果を予測し、問 、合わせ処理の進行状況にあわせて最適な条 件を選択し処理する操作を、問 ヽ合わせで指定された全ての条件を処理するまで繰 り返し、問い合わせの条件を満たす Webページの系列を求める検索方法がある。か 力る検索方法により、 Webページの系列を高速に検索することができる(特許文献 1 参照)。
[0003] 従来の第二の技術として、ユーザ端末により起点として指定されたホームページか ら、ホームページ間に定義されたノヽィパーリンクもしくはユーザの検索要求に応じて ホームページ間の関連性を評価することによって動的に生成するリンクの展開を行な うステップと、展開されたホームページに記述されたテキスト、 HTMLタグで指定され たホームページの属性、およびホームページ内の表現から抽出されたホームページ の属性の評価を繰り返しながら、ユーザ端末力 指定された問い合わせ内容に応じ たホームページとリンクの系列を検索結果として出力するステップとを備える検索方 法がある。力かる検索方法により、あるホームページを起点に情報間の関連性を迪り ながら目的のホームページに到達することと、その情報へ到達するための情報の系 列自体を獲得することができる (特許文献 2参照)。
また、レストラン等の特定種類の店舗を検索するホームページが存在する(非特許 文献 1参照)。
特許文献 1 :特開 2003— 203089 (第 1頁、第 1図等)
特許文献 2 :特開 2001— 344283 (第 1頁、第 1図等)
非特許文献 1:ぐるなびホームページ、インターネットく URL :http:〃 www.gnavi.co.jp
/>
発明の開示
発明が解決しょうとする課題
[0004] しかしながら、上述した従来技術は、 2以上のホームページから 2以上のユーザが 記載した情報を抽出して、多数のユーザの評価に基づいてレストラン等の情報を出 力するものではな力つた。つまり、ユーザは、多数のユーザの客観的情報に基づぐ 店舗等の情報を取得することができなかった。 課題を解決するための手段
[0005] 本第一の発明の情報処理装置は、 2以上の検索対象を特定する情報である検索 情報を受け付ける受付部と、前記検索情報により特定される 2以上の検索対象の評 価に関する情報である 2以上の対象情報を 2以上の元情報力 取得する対象情報取 得部と、前記 2以上の検索対象の対象情報を出力する出力部を具備する情報処理 装置である。
力かる構成により、多数のホームページ等の元情報から、店舗等の検索対象の評 価に関する情報を収集できる情報処理装置を提供できる。
[0006] 本第二の発明の情報処理装置は、第一の発明の情報処理装置における出力部は
、前記 2以上の対象情報を要約し、 2以上の要約情報を取得する要約手段と、前記 2 以上の要約情報を出力する要約情報出力手段を具備する。
力かる構成により、多数の元情報の要約情報を出力するので、限られた面積の表 示画面を有効に利用できる。
[0007] 本第三の発明の情報処理装置は、第二の発明の情報処理装置における要約手段 は、前記対象情報から単語を抽出する単語抽出手段と、前記単語抽出手段が抽出 した各単語における、検索対象毎の出現回数を算出する検索対象毎単語出現回数 算出手段と、前記出現回数に基づいて、前記対象情報から各検索対象の要約情報 を取得する要約取得手段を具備する。
力かる構成により、店舗等の検索対象の特徴を示す単語に着目して要約情報を取 得することにより、好適な要約情報を得ることができる。
[0008] なお、要約手段は、前記単語抽出手段が抽出した各単語における、全部の検索対 象の全対象情報中の出現回数を算出する単語全出現回数算出手段と、前記検索対 象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記単語全出現 回数算出手段が算出した全対象情報中の出現回数との割合を算出する割合算出手 段と、前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単 語リストを作成する単語リスト作成手段をさらに具備し、第三の発明の情報処理装置 の要約取得手段は、前記検索対象毎の単語リストに基づいて、前記対象情報から各 検索対象の要約情報を取得することが好適である。
[0009] 本第四の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載さ れた情報の所在を示す情報であるリンク情報も取得し、前記受付部は、前記要約情 報に対する指示である要約情報選択指示をも受け付け、前記受付部が要約情報選 択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元にな る対象情報が記載された元情報のリンク情報に基づ 、て、当該元情報を取得する元 情報取得部をさらに具備し、前記出力部は、前記元情報取得部が取得した元情報を も出力する元情報出力手段をも具備する構成である。
力かる構成により、要約情報だけでは物足りないユーザにとって、容易に元情報を 取得することができ好適である。
[0010] 本第五の発明の情報処理装置は、上記の対象情報取得部は、対象情報が記載さ れた情報の所在を示す情報であるリンク情報も取得し、前記出力部は、前記リンク情 報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出力手段をさ らに具備し、前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンポ ル選択指示をも受け付け、前記受付部がリンクシンボル選択指示を受け付けた場合 に、前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク 情報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさ らに具備し、前記出力部は、前記元情報取得部が取得した元情報をも出力する元情 報出力手段をも具備する構成である。
力かる構成により、要約を読まずに元情報を取得したいユーザが、容易に元情報を 取得することができ好適である。
[0011] 本第六の発明の情報処理装置は、上記の出力部は、前記 2以上の検索対象の対 象情報に基づ 、て、前記 2以上の検索対象を順位付けするランキング決定手段をさ らに具備し、前記ランキング決定手段の順位付けに基づいて、前記 2以上の検索対 象の対象情報または Zおよび要約情報を出力する。
力かる構成により、ユーザが欲しい店舗等の検索対象の情報が、ランキングされて 出力される。したがって、ユーザが欲する情報を見やすい形態で出力できる。
[0012] 本第七の発明の情報処理装置は、上記のランキング決定手段は、前記 2以上の検 索対象の対象情報の文字数、または Zおよび当該対象情報に電話番号情報が含ま れるか否か、または Zおよび対象情報が記載されて 、る元情報のページランキング に基づ!/、て前記 2以上の検索対象を順位付けする。
力かる構成により、特に、 WEB上のホームページに記載されている店舗等の評判 に基づ!/、て、店舗等をランキングする場合に好適である。
本第八の発明の情報処理装置は、前記検索情報は、検索地点に関する情報であ る検索地点情報と、検索対象のグループを特定する情報である対象グループ情報を 有する。
[0013] 力かる構成により、ユーザの行動特性に合致した店舗等の検索が可能である。行 動特定とは、駅を中心に行動するという都会派の人達の行動特性や、おいしい店で あれば、駅力 徒歩数分ぐらいは歩いて行くであろう、という行動特性である。
[0014] 本第九の発明の情報処理装置は、対象情報取得部は、検索対象の名称を示す情 報である検索対象名称情報と、検索対象の電話番号を示す情報である電話番号情 報と、検索対象の住所を示す情報である住所情報を有する被検索対象情報を 1以上 有する被検索対象情報群を格納して!/ゝる被検索対象情報群格納手段と、前記検索 情報に基づ!、て、前記被検索対象情報群格納手段から被検索対象情報の一部また は全部を取得する被検索対象情報取得手段と、前記被検索対象情報取得手段が取 得した被検索対象情報の一部または全部に基づいて、前記検索情報により特定され る 2以上の検索対象の対象に関する情報である対象情報を取得する対象情報取得 手段を具備する。
力かる構成により、ユーザの要求に合致する店舗等の検索対象の絞込みが適切に できる。
[0015] 本第十の発明の情報処理装置は、上記の検索情報は、さらに検索地点情報が示 す検索地点からの検索範囲を特定する情報である検索範囲情報を含み、前記被検 索対象情報取得手段は、前記検索情報が有する検索地点情報と前記検索対象の 住所情報と前記検索範囲情報に基づ 、て、前記被検索対象情報群格納手段から 1 以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部または全部 を取得する。
力かる構成により、さらにユーザの行動特性に合致した店舗等の検索が可能である
[0016] 本第十一の発明の情報処理装置は、上記の被検索対象情報取得手段は、前記検 索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯度を取 得し、当該 2つの経緯度から前記検索地点情報が示す検索地点と前記住所情報が 示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記検索範 囲情報が示す条件に合致するか否かを判断することにより、前記被検索対象情報群 格納手段から 1以上の被検索対象情報を選択し、当該選択した被検索対象情報の 一部または全部を取得する。
力かる構成により、例えば、駅力も徒歩 10分等の検索情報である場合に、かなり正 確に対象となり得る店舗等の検索対象の情報を得ることができる。
[0017] 本第十二の発明の情報処理装置は、対象情報を取得する元になる情報である元 情報は、階層化されたタグが付された情報であり、前記対象情報取得部は、一の元 情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得する 構成である。
力かる構成により、高速に対象情報を得ることができる。
[0018] 本第十三の発明の情報処理装置は、上記の対象情報取得部は、一の元情報から 複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、住所情 報、郵便番号のうちの 1以上の情報である場所情報を含む階層レベルを決定し、当 該決定した階層レベルの情報を取得する構成である。
力かる構成により、正確に、かつ高速に対象情報を得ることができる。
発明の効果
[0019] 本発明によれば、店舗等の客観的な情報が適切に取得できる。
発明を実施するための最良の形態
[0020] 以下、情報処理システム、情報処理装置等の実施形態につ!、て図面を参照して説 明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行う ので、再度の説明を省略する場合がある。
(実施の形態 1)
[0021] 図 1は、本実施の形態における情報処理システムの概念図である。本情報処理シス テムは、情報端末 11、情報処理装置 12、情報格納装置 13を有する。情報端末 11 は、いわゆるクライアント端末であり、例えば、レストラン等の対象情報を出力する端 末である。対象情報とは、検索情報により特定される 2以上の検索対象 (レストラン等) に関する情報である。力かる対象情報は、例えば、レストラン等の評価 (美味しいや、 お洒落や、まずい等)に関する情報である。情報処理装置 12は、情報端末 11の要 求に応じて対象情報を取得して、当該対象情報を情報端末 11に送信する装置であ る。情報処理装置 12は、例えば、いわゆるサーチエンジンを搭載したアプリケーショ ンサービスプロバイダーのサーバ装置である。情報格納装置 13は、例えば、レストラ ン等の対象情報を格納している装置である。情報格納装置 13は、例えば、情報ポー タルに記載されたレストラン等の評価の情報や、個人のユーザが書き込んだレストラ ン等の評価を示す対象情報や、個人のユーザが記録した日記などの情報を格納し ている。情報処理システムにおいて、通常、情報格納装置 13は複数存在する。対象 情報が記載されている情報を元情報と言う。元情報は、例えば、いわゆる WEBのホ ームページである
[0022] 図 2は、本実施の形態における情報処理システムのブロック図である。情報端末 11 は、ユーザ入力受付部 1101、要求送信部 1102、情報受信部 1103、情報出力部 1 104を有する。情報処理装置 12は、受付部 1201、対象情報取得部 1202、元情報 取得部 1203、出力部 1204、元情報受信部 1205、元情報蓄積部 1206、元情報格 納部 1207を具備する。対象情報取得部 1202は、被検索対象情報群格納手段 120 21、被検索対象情報取得手段 12022、対象情報取得手段 12023を具備する。出 力部 1204は、ランキング決定手段 12041、対象情報出力手段 12042、要約手段 1 2043、要約情報出力手段 12044、元情報出力手段 12045、リンクシンボル出力手 段 12046を具備する。要約手段 12043は、単語抽出手段 120431、検索対象毎単 語出現回数算出手段 120432、単語全出現回数算出手段 120433、割合算出手段 120434、単語リスト作成手段 120435を具備する。情報格納装置 13は、元情報格 納部 1301、元情報送信部 1302を具備する。
ユーザ入力受付部 1101は、ユーザから 2以上の検索対象を特定する情報である 検索情報を受け付ける。検索対象は、例えば、レストランや、英会話学校や、旅行先 などである。検索情報とは、ユーザが欲しい情報を特定するための情報であり、いわ ゆる検索キーである。検索情報は、例えば、検索地点に関する情報である検索地点 情報 (渋谷駅などの駅名や、住所や、電話番号で特定される地域など)と、検索対象 のグループを特定する情報である対象グループ情報 (ラーメン [ラーメン屋と 、う検索 対象のグループを特定する情報]や、イタリャレストランや、中華料理 [中華料理屋と いう検索対象のグループを特定する情報]など)を有する。また、検索情報は、例えば 、さらに検索地点情報が示す検索地点力 の検索範囲を特定する情報である検索 範囲情報 (徒歩 5分以内、 1km以内など)を含んでも良い。さらに、検索情報は、その 他の検索キーを含んでも良い。また、ユーザ入力受付部 1101は、出力されている要 約情報に対する指示である要約情報選択指示をも受け付ける。要約情報は、対象情 報を要約した情報である。対象情報の要約方法は種々ある。対象情報の要約方法 の例については、後述する。また、ユーザ入力受付部 1101は、リンクシンボル情報 に対する指示であるリンクシンボル選択指示をも受け付ける。リンクシンボル情報とは 、対象情報が記載された元情報の所在を示す情報であるリンク情報に対応する情報 である。リンクシンボル情報の具体例は、後述する。さらに、ユーザ入力受付部 1101 は、ユーザ力もの種々の指示や入力も受け付ける。検索情報等の入力手段は、テン キーやキーボードやマウスやメニュー画面によるもの等、何でも良い。ユーザ入力受 付部 1101は、テンキーやキーボード等の入力手段のデバイスドライバーや、メ-ュ 一画面の制御ソフトウェア等で実現され得る。
[0024] 要求送信部 1102は、ユーザ入力受付部 1101が受け付けた検索情報に基づいて 、当該検索情報を有する要求情報を、情報処理装置 12に送信する。要求情報は、 検索情報に対応する検索対象の対象情報を取得する要求を示す情報である。要求 情報のデータ構造は問わない。要求情報は、通常、情報処理装置 12を特定する情 報を含む。情報処理装置 12を特定する情報とは、例えば、情報処理装置 12の中の 、対象情報が有するフォルダを示す URLや URI、または情報処理装置 12の IPアド レス等である。要求送信部 1102は、通常、無線または有線の通信手段を含むが、通 信手段の変わりに放送手段でも良 、。
[0025] 情報受信部 1103は、要求送信部 1102における要求情報の送信に基づいて、対 象情報や元情報等の情報を情報処理装置 12から受信する。情報受信部 1103は、 通常、無線または有線の通信手段で実現されるが、放送受信手段でも実現され得る
[0026] 情報出力部 1104は、情報受信部 1103が受信した対象情報や元情報等の情報を 出力する。ここでの出力とは、ディスプレイへの表示、プリンタへの印字、音出力が主 であるが、外部の装置への送信等を含む概念である。情報出力部 1104は、ディスプ レイやスピーカ一等の出力デバイスを含むと考えても含まないと考えても良い。情報 出力部 1104は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソ フトと出力デバイス等で実現され得る。なお、情報端末 11におけるユーザ入力受付 部 1101、要求送信部 1102、情報受信部 1103、情報出力部 1104などの処理は、 例えば、 V、わゆる WEBブラウザの処理で実現可能である。
[0027] 受付部 1201は、 2以上の検索対象を特定する情報である検索情報や、その他の 情報の取得指示を受け付ける。なお、検索情報は要求情報に含まれる。また、その 他の情報の取得指示は、例えば、 URLを含む情報である。力かるその他の情報の取 得指示を受け付けた場合は、当該 URLで特定される情報 (例えば、ホームページ) が情報端末 11に返送される。受付部 1201は、通常、要求情報を受信する。ここでの 受け付けとは、通常、情報端末 11からの受信を言う。ただし、一般的には、ユーザが 手入力した情報の受け付けや、記録媒体力 の読み出しなども含んでも良い。受付 部 1201は、通常、無線または有線の通信手段で実現されるが、放送を受信する手 段で実現されても良い。また、受付部 1201は、テンキーやキーボード等の入力手段 のデバイスドライバーや、メニュー画面の制御ソフトウェア等でも実現され得る。
[0028] 対象情報取得部 1202は、受付部 1201が受け付けた検索情報により特定される 2 以上の検索対象に関する情報である対象情報を取得する。対象情報を取得する先 は、 2以上の情報格納装置 13でも良いし、情報処理装置 12の元情報格納部 1207 でも良い。対象情報取得部 1202は、通常、 MPUやメモリ等から実現され得る。対象 情報取得部 1202の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアは ROM等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実現しても 良い。なお、対象情報を外部装置力も受信する場合は、対象情報取得部 1202は、 無線または有線の通信手段等も含む構成で実現され得る。
[0029] 元情報取得部 1203は、受付部 1201が要約対象情報選択指示を受け付けた場合 、当該要約対象情報選択指示に対応する要約対象情報の元になる対象情報が記載 された元情報のリンク情報に基づいて、当該元情報を取得する。また、元情報取得 部 1203は、受付部 1201がリンクシンボル選択指示を受け付けた場合に、当該リンク シンボル選択指示に対応するリンクシンボル情報に対応するリンク情報に基づ!/、て、 当該リンク情報が示す対象情報が記載された情報である元情報を取得する。リンク情 報は、例えば、元情報の所在を示す URLや URI等である。かかる場合、元情報取得 部 1203は、例えば、 URLや URI等に対応するホームページを取得する。元情報取 得部 1203は、通常、 MPUやメモリ等力も実現され得る。元情報取得部 1203の処理 手順は、通常、ソフトウェアで実現され、当該ソフトウェアは ROM等の記録媒体に記 録されている。但し、ハードウェア (専用回路)で実現しても良い。なお、元情報を外 部装置から受信する場合は、元情報取得部 1203は、無線または有線の通信手段等 も含む構成で実現され得る。
[0030] 出力部 1204は、 2以上の検索対象の対象情報を出力する。また、出力部 1204は 、 2以上の検索対象の対象情報を要約した情報である 2以上の要約対象情報を出力 しても良い。また、出力部 1204は、下記に説明するように、 2以上の検索対象の対象 情報または Zおよび要約対象情報を、ランキングして出力しても良い。さらに、出力 部 1204は、元情報取得部 1203が取得した元情報をも出力しても良い。出力部 120 4は、リンク情報に対応する情報であるリンクシンボル情報をも出力しても良い。出力 とは、ここでは、通常、情報端末 11への送信である力 ディスプレイへの表示、プリン タへの印字、音出力等を含む概念である。出力部 1204は、通常、送信する情報を構 成するソフトウェア、および無線または有線の通信手段で実現されるが、通信手段の 変わりに放送手段でも良い。また、出力部 1204は、出力部は、出力デバイスのドライ バーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。 出力部 1204は、出力デバイスを含むと考えても含まないと考えても良い。
[0031] 元情報受信部 1205は、情報格納装置 13から元情報を受信する。元情報は、対象 情報を含む情報である。元情報は、例えば、 HTMLやコンパクト HTML (以下、適 宜「C— HTML」という。)や XML等の階層化されたタグが付された情報である。元 情報は、例えば、いわゆるホームページである。元情報受信部 1205が元情報を受 信するタイミングやトリガーは問わない。ここでは、例えば、元情報受信部 1205は、 所定に時刻になると、自動的に多数の情報格納装置 13から、元情報を取得する。元 情報受信部 1205は、通常、無線または有線の通信手段で実現されるが、放送を受 信する手段で実現されても良い。
[0032] 元情報蓄積部 1206は、元情報受信部 1205が受信した元情報を元情報格納部 1 207に蓄積する。元情報蓄積部 1206は、通常、 MPUやメモリ等から実現され得る。 元情報蓄積部 1206の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェア は ROM等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実現して も良い。
元情報格納部 1207は、元情報を格納している。元情報格納部 1207は、不揮発性 の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
[0033] 被検索対象情報群格納手段 12021は、検索対象の名称を示す情報である検索対 象名称情報と、検索対象の電話番号を示す情報である電話番号情報と、検索対象 の住所を示す情報である住所情報を有する被検索対象情報を 1以上有する被検索 対象情報群を格納している。なお、被検索対象情報は、郵便番号を示す情報である 郵便番号情報を有しても良い。被検索対象情報群は、例えば、いわゆるイエローべ ージの情報である。被検索対象情報群格納手段 12021は、不揮発性の記録媒体が 好適であるが、揮発性の記録媒体でも実現可能である。
[0034] 被検索対象情報取得手段 12022は、検索情報に基づいて、被検索対象情報群格 納手段 12021から被検索対象情報の一部または全部を取得する。被検索対象情報 取得手段 12022は、例えば、検索情報が有する業種の情報 (例えば、「英会話学校 」や「ラーメン屋」など)を有する被検索対象情報の一部または全部を取得する。被検 索対象情報取得手段 12022は、通常、 MPUやメモリ等カゝら実現され得る。被検索 対象情報取得手段 12022の処理手順は、通常、ソフトウェアで実現され、当該ソフト ウエアは ROM等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実 現しても良い。
[0035] 対象情報取得手段 12023は、被検索対象情報取得手段 12022が取得した被検 索対象情報の一部または全部に基づいて、検索情報により特定される 2以上の検索 対象に関する情報である対象情報を取得する。対象情報取得手段 12023は、一の 元情報力も複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情 報、住所情報、郵便番号のうちの 1以上の情報である場所情報を含む階層レベルと 所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得する 。対象情報取得手段 12023は、例えば、被検索対象情報取得手段 12022が取得し た電話番号情報と住所情報と郵便番号情報のうちの 2以上の情報を含む、所定の塊 の情報を取得する。所定の塊の情報とは、一段落の情報であっても、一ページの情 報であっても、所定のタグ (例えば、「く tr>」)が付された情報であっても良い。対象 情報取得手段 12023は、通常、 MPUやメモリ等力も実現され得る。対象情報取得 手段 12023の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアは ROM 等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実現しても良い。
[0036] ランキング決定手段 12041は、 2以上の検索対象の対象情報に基づいて、 2以上 の検索対象を順位付けする。ランキング決定手段 12041は、例えば、全対象情報の 文字数に基づ 、て 2以上の検索対象を順位付けしても良 、し、全対象情報の数 (記 載されている記事数)に基づいて 2以上の検索対象を順位付けしても良い。ランキン グ決定手段 12041は、 2以上の検索対象の対象情報に電話番号情報が含まれるか 否力 または対象情報が記載されて 、る元情報のページランキングに基づ 、てラン キングを決定しても良い。元情報(たとえば、 WEBページ)のページランキングは、例 えば、予め保持している、とする。 WEBページのページランキングを決定する方法に は、公知の種々の方法がある。公知の種々の方法とは、他のホームページにリンクさ れている数の多さによりランキングする方法等である。力かる公知の方法により、 WE Bページのページランキングを決定しても良い。その他、 2以上の検索対象を順位付 けするアルゴリズムは問わない。ランキング決定手段 12041は、通常、 MPUやメモリ 等から実現され得る。ランキング決定手段 12041の処理手順は、通常、ソフトウェア で実現され、当該ソフトウェアは ROM等の記録媒体に記録されている。但し、ハード ウェア (専用回路)で実現しても良 、。
[0037] 対象情報出力手段 12042は、ランキング決定手段 12041の順位付けに基づいて 、 2以上の検索対象の対象情報を出力する。対象情報出力手段 12042は、通常、上 位にランキングされている検索対象に関する情報 (対象情報や要約情報や検索対象 の名称など)力もユーザに提示されるように情報を構成し、出力する。出力とは、ここ では、通常、情報端末 11への送信であるが、ディスプレイへの表示、プリンタへの印 字、音出力等を含む概念である。
[0038] 要約手段 12043は、 2以上の対象情報を要約し、 2以上の要約情報を取得する。
要約の仕方は問わない。要約手段 12043は、例えば、対象情報の先頭 50文字を取 得して、力かる文字列を要約情報とする。要約手段 12043は、通常、 MPUやメモリ 等から実現され得る。要約手段 12043の処理手順は、通常、ソフトウェアで実現され 、当該ソフトウェアは ROM等の記録媒体に記録されている。但し、ハードウ ア(専用 回路)で実現しても良い。
[0039] 要約情報出力手段 12044は、要約手段 12043が取得した 2以上の要約情報を出 力する。出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置へ の送信等を含む概念である。ここでは、通常、出力とは、情報端末 11への送信であ る。要約情報出力手段 12044は、例えば、無線または有線の通信手段で実現される [0040] 元情報出力手段 12045は、元情報取得部 1203が取得した元情報を出力する。出 力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部の装置への送信等 を含む概念である。ここでは、通常、出力とは、情報端末 11への送信である。元情報 出力手段 12045は、例えば、無線または有線の通信手段で実現される。
[0041] リンクシンボル出力手段 12046は、リンク情報に対応する情報であるリンクシンボル 情報を出力する。リンクシンボル情報とは、例えば、レストラン等の評価情報のリンク 元であることを示す文字列である「評価 1」「評価 2」や、レストラン等の評価情報のリン ク元であることを示すイメージ (アイコン)等である。出力の概念は、上述したとおりで ある。リンクシンボル出力手段 12046は、例えば、無線または有線の通信手段で実 現される。
[0042] 単語抽出手段 120431は、対象情報から単語を抽出する。単語を抽出するァルゴ リズムは種々ある。例えば、単語抽出手段 120431は、辞書を保持しており、かかる 辞書に登録している単語を抽出する。また、単語抽出手段 120431は、名詞を抽出 しても良い。かかる技術は、公知の言語処理技術であるので、詳細な説明は省略す る。単語抽出手段 120431は、通常、 MPUやメモリ等力も実現され得る。単語抽出 手段 120431の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアは RO M等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実現しても良い
[0043] 検索対象毎単語出現回数算出手段 120432は、単語抽出手段 120431が抽出し た各単語における、検索対象毎の出現回数を算出する。検索対象毎単語出現回数 算出手段 120432は、通常、 MPUやメモリ等力も実現され得る。検索対象毎単語出 現回数算出手段 120432の処理手順は、通常、ソフトウェアで実現され、当該ソフト ウエアは ROM等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実 現しても良い。
[0044] 単語全出現回数算出手段 120433は、単語抽出手段 120431が抽出した各単語 における、全部の検索対象の全対象情報中の出現回数を算出する。単語全出現回 数算出手段 120433は、通常、 MPUやメモリ等力も実現され得る。単語全出現回数 算出手段 120433の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアは ROM等の記録媒体に記録されている。但し、ハードウ ア(専用回路)で実現しても 良い。
[0045] 割合算出手段 120434は、検索対象毎単語出現回数算出手段 120432が算出し た検索対象毎の出現回数と単語全出現回数算出手段 120433が算出した全対象情 報中の出現回数との割合を算出する。割合算出手段 120434は、通常、 MPUゃメ モリ等から実現され得る。割合算出手段 120434の処理手順は、通常、ソフトウェア で実現され、当該ソフトウェアは ROM等の記録媒体に記録されている。但し、ハード ウェア (専用回路)で実現しても良 、。
[0046] 単語リスト作成手段 120435は、割合算出手段 120434が算出した割合が高い単 語から並べて、検索対象毎の単語リストを作成する。単語リスト作成手段 120435は、 通常、 MPUやメモリ等力も実現され得る。単語リスト作成手段 120435の処理手順 は、通常、ソフトウェアで実現され、当該ソフトウェアは ROM等の記録媒体に記録さ れている。但し、ハードウェア(専用回路)で実現しても良い。
[0047] なお、出力部 1204が保持している各出力手段は、通常、物理的に一の手段で実 現されている。また、出力部 1204は、通常、要約情報やリンクシンボル情報などの出 力対象の情報から一のファイル(例えば、 HTMLで記述されたファイル)を構成し、 当該ファイルを情報端末 11に送信する。また、出力部 1204が、対象情報、要約情 報、元情報、リンクシンボル情報のうちの 1以上の情報を出力する場合は、出力部 12 04は、例えば、力かる情報を合成して、一のファイルを構成する処理を行う。さらに具 体的には、出力部 1204は、 2以上の検索対象 (例えば、 2以上のレストラン)の対象 情報、要約情報、元情報、リンクシンボル情報のうちの 1以上の情報からなる WEBぺ ージを構成し、出力する。
[0048] 元情報格納部 1301は、 1以上の元情報を格納している。元情報は、検索対象の対 象情報を有する。元情報は、例えば、 HTMLや C HTMLや XML等で記述された いわゆるページである。元情報格納部 1301は、不揮発性の記録媒体が好適である 力 揮発性の記録媒体でも実現可能である。
[0049] 元情報送信部 1302は、元情報格納部 1301の元情報を送信する。元情報送信部 1302が元情報を送信するトリガーやタイミングは問わない。元情報送信部 1302は、 例えば、情報処理装置 12の要求により元情報を送信する。元情報送信部 1302は、 通常、無線または有線の通信手段で実現されるが、放送手段で実現されても良い。 以下、本情報処理システムの動作について説明する。まず、情報端末 11の動作に つ ヽて図 3のフローチャートを用いて説明する。
(ステップ S301)ユーザ入力受付部 1101は、ユーザからの入力を受け付けた否か を判断する。入力を受け付ければステップ S302に行き、入力を受け付けなければス テツプ S301に戻る。
[0050] (ステップ S302)ユーザ入力受付部 1101は、ステップ S301で受け付けた入力が 検索情報であるか否かを判断する。検索情報であればステップ S303に行き、検索 情報でなければステップ S307に飛ぶ。
(ステップ S303)要求送信部 1102は、ステップ S301で受け付けた検索情報に基 づいて、要求情報を構成する。要求情報とは、検索対象の対象情報の取得を要求す る情報である。
(ステップ S304)要求送信部 1102は、ステップ S303、ステップ S308またはステツ プ S310で構成した情報を送信する。
(ステップ S305)情報受信部 1103は、対象情報等の情報を情報処理装置 12から 受信した力否かを判断する。情報を受信すればステップ S306に行き、情報を受信し なければステップ S305に戻る。
[0051] (ステップ S306)情報出力部 1104は、ステップ S305で受信した情報を出力する。
なお、力かる情報出力部 1104は、例えば、情報受信部 1103が受信した HTMLで 記述されたファイルを解釈し、ページを構成して、当該ページをディスプレイに表示 する。ステップ S 301〖こ戻る。
[0052] (ステップ S307)ユーザ入力受付部 1101は、ステップ S301で受け付けた入力が 要約情報選択指示であるか否かを判断する。要約情報選択指示であればステップ S
308に行き、要約情報選択指示でなければステップ S 309に飛ぶ。
[0053] (ステップ S308)要求送信部 1102は、要約情報選択指示を含む情報取得の要求 を構成する。なお、構成する情報は、要約情報選択指示に対応する要約情報の元に なる対象情報が記載された元情報のリンク情報を含む。リンク情報は、例えば、元情 報の所在を示す URLや URIである。テツプ S304〖こ行く。
[0054] (ステップ S309)ユーザ入力受付部 1101は、ステップ S301で受け付けた入力がリ ンクシンボル選択指示であるカゝ否かを判断する。リンクシンボル選択指示であればス テツプ S310に行き、リンクシンボル選択指示でなければステップ S311に飛ぶ。
[0055] (ステップ S310)要求送信部 1102は、リンクシンボル選択指示を含む情報取得の 要求を構成する。なお、構成する情報は、リンクシンボル選択指示に対応する元情報 のリンク情報を含む。リンク情報は、例えば、元情報の所在を示す URLや URIである
。ステップ S304に行く。
(ステップ S311)受け付けた入力に応じた処理を行う。力かる処理は種々ある。 かる処理は、例えば、いわゆる WEBブラウザが行う処理である。ステップ S301〖こ戻 る。
なお、図 3のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は 終了する。
次に、情報処理装置 12の動作について図 4のフローチャートを用いて説明する。 (ステップ S401)受付部 1201は、情報を受け付けた力否かを判断する。情報を受 け付ければステップ S402に行き、情報を受け付けなければステップ S401に戻る。
[0056] (ステップ S402)受付部 1201は、ステップ S401で受け付けた情報が検索情報を 含むか否かを判断する。検索情報を含む場合はステップ S403に行き、検索情報を 含まない場合はステップ S406に飛ぶ。検索情報を含む場合とは、ここでは、上述し た要求情報を受け付けた場合である。
[0057] (ステップ S403)対象情報取得部 1202は、ステップ S401で受け付けた検索情報 により特定される 2以上の検索対象に関する情報である対象情報を取得する。かかる 対象情報取得処理の詳細は、図 5のフローチャートを用いて説明する。
(ステップ S404)出力部 1204は、情報端末 11に送信する情報を構成する。かかる 送信情報構成処理の詳細は、図 6のフローチャートを用いて説明する。
(ステップ S405)出力部 1204は、ステップ S404で構成した情報を出力する。ここ での出力は、情報端末 11への送信である。ステップ S401に戻る。
[0058] (ステップ S406)受付部 1201は、ステップ S401で受け付けた情報が要約情報選 択指示であるか否かを判断する。要約情報選択指示であればステップ S407に行き 、要約情報選択指示でなければステップ S408に飛ぶ。
(ステップ S407)元情報取得部 1203は、要約対象情報選択指示に対応する要約 対象情報の元になる対象情報が記載された元情報のリンク情報に基づいて、当該元 情報を取得する。ステップ S405に行く。
[0059] (ステップ S408)受付部 1201は、ステップ S401で受け付けた情報がシンボル情 報選択指示であるか否かを判断する。シンボル情報選択指示であればステップ S40 8に行き、シンボル情報選択指示でなければステップ S401に戻る。
(ステップ S409)元情報取得部 1203は、指示されたリンクシンボル情報に対するリ ンク情報に基づ 、て、当該リンク情報が示す対象情報が記載された情報である元情 報を取得する。ステップ S405〖こ行く。
なお、図 4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は 終了する。
次に、情報処理装置 12の対象情報取得処理の動作について図 5のフローチャート を用いて説明する。
(ステップ S501)被検索対象情報取得手段 12022は、カウンタ iに 1を代入する。
[0060] (ステップ S502)被検索対象情報取得手段 12022は、潘目の被検索対象情報が 存在するか否かを判断する。 i番目の被検索対象情報が存在すればステップ S 503 に行き、 i番目の被検索対象情報が存在しなければステップ S506に飛ぶ。
[0061] (ステップ S503)被検索対象情報取得手段 12022は、潘目の被検索対象情報が 、検索情報の要件を満たすカゝ否か判断する。検索情報の要件を満たせばステップ S 504に行き、検索情報の要件を満たさなければステップ S505に飛ぶ。なお、 i番目の 被検索対象情報が、検索情報の要件を満たす力否力の判断方法は種々ある。例え ば、潘目の被検索対象情報が、すべての検索情報を構成する情報を有する場合に 、検索情報の要件を満たす力と判断しても良い。また、例えば、 i番目の被検索対象 情報が、検索情報を構成する情報の中の所定数の情報を有する場合に、検索情報 の要件を満たす力と判断しても良い。さらに、後述するように、 i番目の被検索対象情 報の位置、業種の情報等に基づいて、検索情報 (たとえば、「JR山手線新宿から約 徒歩 10分のラーメン屋」など)に合致する力否かを判断しても良!、。
[0062] (ステップ S504)被検索対象情報取得手段 12022は、検索情報の要件を満たした 被検索対象情報の一部または全部を取得する。力かる被検索対象情報の一部また は全部は、検索キーである。被検索対象情報取得手段 12022は、検索キーを一時 格納する。
(ステップ S505)被検索対象情報取得手段 12022は、カウンタ iを 1、インクリメント する。ステップ S 502に戻る。
(ステップ S506)被検索対象情報取得手段 12022は、カウンタ iに 1を代入する。
[0063] (ステップ S507)対象情報取得手段 12023は、 i番目の検索キーが存在するか否 かを判断する。 i番目の検索キーが存在すればステップ S508に行き、 i番目の検索キ 一が存在しなければ上位関数にリターンする。
(ステップ S508)対象情報取得手段 12023は、カウンタ jに 1を代入する。
[0064] (ステップ S509)対象情報取得手段 12023は、元情報格納部 1207に、 j番目の元 情報が存在するか否かを判断する。潘目の元情報が存在すればステップ S510〖こ 行き、 j番目の元情報が存在しなければステップ S517に飛ぶ。
[0065] (ステップ S510)対象情報取得手段 12023は、 i番目の検索キーに対応する検索 対象タグが存在するか否かを判断する。検索対象タグが存在すればステップ S511 に行き、検索対象タグが存在しなければステップ S518に飛ぶ。なお、すべての検索 キーに対応する検索対象タグの初期値は、 NULL (検索対象タグが存在しな!ヽ)で ある。
(ステップ S511)対象情報取得手段 12023は、カウンタ kに 1を代入する。
[0066] (ステップ S512)対象情報取得手段 12023は、 j番目の元情報の中に、 k番目の検 索対象タグが存在するか否かを判断する。 k番目の検索対象タグが存在すればステ ップ S513に行き、 k番目の検索対象タグが存在しなければステップ S516に飛ぶ。
(ステップ S513)対象情報取得手段 12023は、力かる検索対象タグに対応する情 報を取得する。かかる情報は、対象情報の候補となる。
[0067] (ステップ S514)対象情報取得手段 12023は、ステップ S 513で取得した情報が、 検索キーで示される条件に合致するか否かを判断する。条件に合致すればステップ S515に行き、条件に合致しなければステップ S521に飛ぶ。なお、検索キーで示さ れる条件に合致するか否かは、種々のアルゴリズムにより決定され得る。例えば、ステ ップ S513で取得した情報が、検索キーが有する 2以上の情報 (例えば、店舗名、住 所情報、電話番号情報、郵便番号情報)のうち、 1以上を含む場合に条件に合致す る、と判断しても良い。また、例えば、ステップ S 513で取得した情報力 検索キーが 有する店舗名を含み、住所情報の一部を含む場合に条件に合致する、と判断しても 良い。
(ステップ S515)対象情報取得手段 12023は、ステップ S 513で取得した情報を一 時格納する。かかる情報は、対象情報である。対象情報は、検索キーまたは被検索 対象情報と対に格納される。
(ステップ S516)対象情報取得手段 12023は、カウンタ jを 1、インクリメントする。ス テツプ S509に戻る。
(ステップ S517)対象情報取得手段 12023は、カウンタ iを 1、インクリメントする。ス テツプ S507に戻る。
[0068] (ステップ S518)対象情報取得手段 12023は、 j番目の元情報が、検索キーで示さ れる条件に合致する箇所があるか否かを判断する。つまり、例えば、検索キーが「店 舗名」「電話番号情報」「住所情報」を有する場合、「店舗名」「電話番号情報」「住所 情報」のうち、 2以上の情報を含む場合に、当該箇所が条件に合致する箇所であると する。その他、 j番目の元情報が、検索キーで示される条件に合致する箇所が存在す る力否かを判断するアルゴリズムは、種々のアルゴリズムが考えられる。
(ステップ S519)対象情報取得手段 12023は、検索キーで示される条件に合致す る箇所に対応するタグを取得する。
[0069] (ステップ S520)対象情報取得手段 12023は、 j番目の元情報に対応する検索タ グとして、ステップ S519で取得したタグを登録する。ここで、登録とは、メモリや所定 のバッファに書き込むことを言う。ステップ S515に行く。
(ステップ S521)対象情報取得手段 12023は、カウンタ kを 1、インクリメントする。ス テツプ S512に戻る。
[0070] なお、本フローチャートにおいて、対象情報取得手段 12023は、元情報のタグ構 造を利用して、一の元情報から複数の対象情報を取得する場合に、同一の階層レべ ルの情報を取得する処理を行った。しかし、本フローチャートにおける処理は、一の 元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取得す る処理の一例である。例えば、まず、対象情報取得手段 12023は、元情報のタグ構 造木を構成し、その構造木の中に、 2以上の場所情報 (住所情報や電話番号情報や 郵便番号情報など)を含むタグを検索タグとして登録しても良い。そして、検索時は、 登録された検索タグに対応する情報のみを対象として、検索キーで示される条件に 合致する力否かを判断しても良い。なお、上記で、 2以上の場所情報を含むタグを検 索タグとして登録するとしたが、 1以上の場所情報を含むタグを検索タグとして登録し ても良いし、 3以上の場所情報を含むタグを検索タグとして登録しても良い。その他、 対象情報取得手段 12023は、一の元情報力も複数の対象情報を取得する場合に、 同一の階層レベルの情報を取得する処理を行えば良ぐその処理手順等は問わな いことは言うまでもない。
次に、情報処理装置 12の送信情報構成処理の動作について図 6のフローチャート を用いて説明する。
[0071] (ステップ S601)ランキング決定手段 12041は、 2以上の検索対象の対象情報に 基づいて、 2以上の検索対象を順位付けする。力かる順位付けの処理であるランキン グ処理の詳細については、図 7のフローチャートを用いて説明する。
(ステップ S602)対象情報出力手段 12042は、カウンタ iに 1を代入する。
(ステップ S603)対象情報出力手段 12042は、 i番目の対象情報の見出しを構成 する。見出しの構成方法は種々ある。具体的な見出しの構成方法は後述する。
(ステップ S604)対象情報出力手段 12042は、カウンタ jに 1を代入する。
[0072] (ステップ S605)リンクシンボル出力手段 12046は、 j番目のリンクシンボル情報を 構成する。リンクシンボル情報の構成の際に、元情報の所在を示すリンク情報を使用 する。リンクシンボル情報が押下された場合に、元情報取得部 1203が、リンク情報を 用 、て元情報にアクセスするためである。
(ステップ S606)要約手段 12043は、要約情報を取得する。要約情報を取得する 処理である要約情報取得処理の詳細については、図 8のフローチャートを用いて説 明する。
[0073] (ステップ S607)対象情報出力手段 12042は、 1以上の要約情報を用いて要約部 を構成する。なお、要約部は、出力する情報を構成する情報である。要約部の構成 には、要約部の要約情報と、当該要約情報が構成された元となる元情報のリンク情 報も使用される。要約情報が押下された場合に、元情報取得部 1203が、リンク情報 を用いて元情報にアクセスするためである。
(ステップ S608)カウンタ jを 1、インクリメントする。
[0074] (ステップ S609)対象情報出力手段 12042は、 i番目の検索対象の全てのリンクシ ンボル情報、要約情報の処理が完了した力否か (jがラストか否力 )を判断する。かか る判断は、先に抽出した要約情報の処理が完了したことにより行っても良いし、予め 決められた所定数の要約情報の処理が完了したことにより行っても良い。 jがラストで あればステップ S610に行き、 jがラストでなければステップ S605に戻る。
(ステップ S610)対象情報出力手段 12042は、カウンタ iを 1、インクリメントする。
[0075] (ステップ S611)対象情報出力手段 12042は、 i番目の検索対象が存在するか否 かを判断する。 i番目の検索対象が存在すればステップ S612に行き、 i番目の検索 対象が存在しなければステップ S603に飛ぶ。
[0076] (ステップ S612)対象情報出力手段 12042は、出力する情報を構成する。かかる 処理は、例えば、 HTMLファイルの「く ZHTML>」等のタグをファイルの最終行に 記録することである。つまり、送信する情報を構成するための後処理である。上位関 数にリターンする。
次に、情報処理装置 12のランキング処理の動作について図 7のフローチャートを用 いて説明する。
(ステップ S701)ランキング決定手段 12041は、カウンタ iに 1を代入する。
[0077] (ステップ S702)ランキング決定手段 12041は、 i番目の検索対象が存在するか否 かを判断する。 i番目の検索対象が存在すればステップ S703に行き、 i番目の検索 対象が存在しなければステップ S713に飛ぶ。
(ステップ S703)ランキング決定手段 12041は、 i番目の検索対象のポイント情報に 0を代入する。ポイント情報とは、ランキングを決定するために利用する情報である。 (ステップ S704)ランキング決定手段 12041は、カウンタ jに 1を代入する。
[0078] (ステップ S705)ランキング決定手段 12041は、 i番目の検索対象における、 j番目 の対象情報が存在するか否かを判断する。 j番目の対象情報が存在すればステップ S706に行き、 j番目の対象情報が存在しなければステップ S714に飛ぶ。
(ステップ S706)ランキング決定手段 12041は、 j番目の対象情報のデータ量を取 得する。データ量とは、文字数でも、バイト数 (データ長)でも、単語数でも、文章数等 でも良い。
[0079] (ステップ S707)ランキング決定手段 12041は、 j番目の対象情報の元情報のぺー ジランクを取得する。情報処理装置 12は、例えば、元情報に対応して、当該元情報 のページランクを予め保持している、とする。
[0080] (ステップ S708)ランキング決定手段 12041は、 j番目の対象情報の中に、 i番目の 検索対象の電話番号情報が含まれるか否かを判断する。電話番号情報が含まれれ ばステップ S709に行き、電話番号情報が含まれなければステップ S715に飛ぶ。
(ステップ S709)ランキング決定手段 12041は、電話番号フラグに ONを代入する 。電話番号フラグとは、 i番目の検索対象の電話番号情報が含まれるか否かを示すフ ラグである。
[0081] (ステップ S710)ランキング決定手段 12041は、ステップ S 706で取得したデータ 量、ステップ S707で取得した元情報のページランク、電話番号フラグの中の 1以上 の情報に基づ 、てポイントを算出する。具体的なポイント算出のアルゴリズムの例は、 後述する。
(ステップ S 711 )ランキング決定手段 12041は、ステップ S 710で算出したポイント を、 i番目の検索対象のポイント情報に加算する。
(ステップ S712)ランキング決定手段 12041は、カウンタ jを 1、インクリメントする。ス テツプ S705に行く。
(ステップ S713)ランキング決定手段 12041は、ポイント情報をキーにして、検索対 象をソートする。上位関数にリターンする。
(ステップ S714)ランキング決定手段 12041は、カウンタ iを 1、インクリメントする。ス テツプ S702に行く。 (ステップ S 715)ランキング決定手段 12041は、電話番号フラグに OFFを代入する 。ステップ S710に行く。
図 7のフローチャートにおいて、ランキング決定手段 12041は、 2以上の検索対象 の対象情報の文字数、および当該対象情報に電話番号情報が含まれるか否か、お よび対象情報が記載されて!、る元情報のページランキングに基づ!、て 2以上の検索 対象を順位付けした。しかし、ランキング決定手段 12041は、 2以上の検索対象の対 象情報の文字数、電話番号情報が含まれるか否か、ページランキングのうちの 1以上 の情報に基づいて、 2以上の検索対象を順位付けしても良い。さらに、ランキング決 定手段 12041は、 2以上の検索対象の記事の数など、他の情報に基づいて、 2以上 の検索対象を順位付けしても良 、。
次に、情報処理装置 12の要約情報取得処理の動作について図 8のフローチャート を用いて説明する。
(ステップ S801)要約手段 12043は、カウンタ iに 1を代入する。
(ステップ S802)要約手段 12043は、 i番目の検索対象が存在するか否かを判断 する。 i番目の検索対象が存在すればステップ S803に行き、 i番目の検索対象が存 在しなければ上位関数にリターンする。
(ステップ S803)単語抽出手段 120431は、カウンタ j、 kに 1を代入する。
(ステップ S804)単語抽出手段 120431は、 j番目の対象情報から k番目の単語を 抽出する。
(ステップ S805)検索対象毎単語出現回数算出手段 120432は、 i番目の検索対 象の全対象情報中における、ステップ S804で抽出された単語の出現回数 (第一出 現回数)を算出する。
(ステップ S806)単語全出現回数算出手段 120433は、全部の検索対象の全対象 情報中における、ステップ S804で抽出された単語の出現回数 (第二出現回数)を算 出する。
(ステップ S807)割合算出手段 120434は、第一出現回数の第二出現回数に対す る割合を算出する。
(ステップ S808)単語リスト作成手段 120435は、ステップ S804で抽出された単語 と、ステップ S807で算出された割合の情報を対にして登録 (一時蓄積)する。
(ステップ S809)単語抽出手段 120431は、カウンタ kを 1、インクリメントする。
[0083] (ステップ S810)単語抽出手段 120431は、 j番目の対象情報から k番目の単語が 存在するか否かを判断する。この k番目の単語とは、今まで未処理であった単語であ る。 k番目の単語が存在すればステップ S804に行き、 k番目の単語が存在しなけれ ばステップ S811に行く。
(ステップ S811)カウンタ jを 1、インクリメントする。
[0084] (ステップ S812)単語リスト作成手段 120435は、 i番目の検索対象の j番目の対象 情報が存在するか否かを判断する。 j番目の対象情報が存在すればステップ S804 に行き、 j番目の対象情報が存在しなければステップ S813に行く。
(ステップ S813)単語リスト作成手段 120435は、割合の情報に基づいて、単語を ソートする。カゝかるソートにより上位にくる単語が、検索対象特有の単語であると、例 えば、考える。
(ステップ S814)要約手段 12043は、カウンタ mに 1を代入する。
[0085] (ステップ S815)要約手段 12043は、 i番目の検索対象の要約情報が所定のサイ ズより大きいか否かを判断する。なお、各検索対象の要約情報の初期値は NULLで ある。所定のサイズより大きければステップ S818に行き、所定のサイズ以下であれば ステップ S816に行く。
(ステップ S816)要約手段 12043は、 m番目の単語が入っている文章を、 i番目の 検索対象の全対象情報から取得し、要約情報として追記する。
(ステップ S817)要約手段 12043は、カウンタ mを、 1インクリメントする。
(ステップ S818)要約手段 12043は、要約情報を所定のサイズ以内になるように力 ットする。カットとは、所定のサイズより先の情報を消去する処理である。
(ステップ S819)要約手段 12043は、カウンタ iを、 1インクリメントする。ステップ S8 02に行く。
[0086] なお、図 8のフローチャートにおいて、検索対象の特徴となる単語に着目して要約 情報を取得する一アルゴリズムを示した。しかし、要約手段 12043は、対象情報から 単語を抽出する単語抽出手段と、単語抽出手段が抽出した各単語における、検索 対象毎の出現回数を算出する検索対象毎単語出現回数算出手段と、出現回数に基 づ 、て、対象情報から各検索対象の要約情報を取得する要約取得手段を具備すれ ば良い。つまり、必ずしも、第一出現回数の第二出現回数に対する割合に基づいて 単語リストを構成する必要はな 、。
別のアルゴリズムとして、例えば、以下のようなアルゴリズムもある。「i番目の検索対 象の全対象情報に含まれる文の集合」から 1文ずつ取り出し、その文に含まれる特徴 単語の得点と割合でスコアリングしていく。たとえば「特製餃子がお勧め」という文に 対し、「特製」が特徴単語 5位 (4. 6ポイント)、「餃子」が特徴単語 3位 (5. 0ポイント) だとすると、この文のスコアは 9. 6/単語数となる。一方、「このお店のお勧めは特製 の黒豚を使用した餃子です」と!、う文にも「特製」と「餃子」が含まれて ヽますが、単語 数が多いので前の例より低いスコアとなる。しかし、もし「黒豚」が特徴単語 1位で十分 にポイントが高いような場合には、こちらの文が優先的に選択されることになる。なお 、特徴単語とは検索対象特有の単語であり、そのポイントとは、当該単語の検索対象 の特有度合いを示す情報である。以上のように、出現回数は、上記のポイントの概念 、その他の単語の出現度合いの概念を含む概念である。つまり、要約取得手段は、 出現回数に基づ 、て、対象情報力 各検索対象の要約情報を取得するような構成 である。
以下、本実施の形態における情報処理システムの具体的な動作にっ 、て説明する 。情報処理システムの概念図は図 1である。
[0087] 情報端末 11は、 WEBブラウザが搭載された、例えば、パーソナルコンピュータであ る。情報端末 11は、例えば、ラーメン屋等の対象情報を出力する端末である。情報 処理装置 12は、例えば、いわゆるサーチエンジンを搭載したサーバ装置である。情 報格納装置 13は、例えば、ラーメン屋のホームページを格納しているサーバ装置で ある。ホームページは、例えば、 HTMLで記述されている。
[0088] 図 9は、情報処理装置 12が、多数の情報格納装置 13から受信したホームページの 例を示す。力かるホームページは、上述した元情報に該当する。元情報受信部 120 5は、情報格納装置 13からホームページを受信し、元情報蓄積部 1206は、元情報 受信部 1205が受信した当該ホームページを元情報格納部 1207に蓄積する。元情 報格納部 1207は、多数のホームページを格納して!/、る。
[0089] 図 10は、被検索対象情報群格納手段 12021が格納している被検索対象情報群で ある。被検索対象情報群は、「検索対象名称情報」「郵便番号情報」「住所情報」「電 話番号情報」を有する。「検索対象名称情報」は、例えば、店舗名である。被検索対 象情報群は、例えば、いわゆるイェローページである。
[0090] 図 11は、情報ポータル管理表である。情報ポータル管理表は、信頼性の高!、情報 ポータルの HPの URLを管理して 、る。力かる情報ポータル管理表に管理されて ヽ る URLで識別されるホームページは、ページランクが高いホームページである。一方 、情報ポータル管理表で管理されていないホームページは、ページランクが低いホ ームページである。なお、ページランクの情報は、ランキング決定手段 12041が利用 する。
[0091] 今、ユーザは、情報端末 11から情報処理装置 12のホームページの URLを入力し 、当該ホームページにアクセスしたとする。そして、情報端末 11は、レストランの検索 を行うためのホームページを受信し、表示した、とする。次に、ユーザは、検索したい レストラン(ここでは、ラーメン屋)の情報を得るためにホームページのフィールドに検 索情報を入力する(図 12参照)。検索情報は、ここでは、「検索地点」を示す情報、「 範囲」を示す情報、「キーワード」を有する。そして、ユーザは、検索情報を入力後、「 検索」ボタンを押下する、とする。図 12において、ユーザは、 JR山手線新宿力も約徒 歩 10分以内の場所にあるラーメン屋を検索することとなる。
[0092] 次に、情報端末 11の要求送信部 1102は、検索地点「JR山手線新宿」、範囲「約徒 歩 10分」、キーワード「ラーメン」を有する要求情報(図 13参照)を構成し、当該要求 情報を情報処理装置 12に送信する。なお、図 13の要求情報の「1」は検索をすること を指示する検索フラグである。また、要求情報の名称の「一」は名称が検索キーでは ないことを示す。
[0093] 次に、情報処理装置 12の受付部 1201は、情報端末 11から要求情報を受信する。
要求情報は、 2以上の検索対象を特定する情報である検索情報を有する。次に、被 検索対象情報取得手段 12022は、受信した検索情報 (検索地点「JR山手線新宿」、 範囲「約徒歩 10分」、キーワード「ラーメン」)に基づいて、被検索対象情報群格納手 段 12021から被検索対象情報の一部または全部を取得する。具体的には、被検索 対象情報取得手段 12022は、 JR山手線新宿力も約徒歩 10分の距離を算出する。 かかる場合、例えば、被検索対象情報取得手段 12022は、徒歩 1分を 80mとして算 出し、 JR山手線新宿力も 800m以内のラーメン店を、図 10の被検索対象情報群から 算出する。被検索対象情報取得手段 12022は、例えば、 JR山手線新宿等の多数の 検索地点の住所を保持しており、かつ、住所を緯度経度に変換するための地図情報 を保持している。そして、被検索対象情報取得手段 12022は、 JR山手線新宿の住 所から JR山手線新宿の位置情報 (緯度と経度)を取得する。次に、被検索対象情報 取得手段 12022は、図 10の被検索対象情報群の住所情報から位置情報 (緯度と経 度)を取得する。そして、被検索対象情報取得手段 12022は、 JR山手線新宿の位置 情報と検索対象の店舗の位置情報力も距離を算出し、 800m以内であるかどうか判 断する。そして、被検索対象情報取得手段 12022は、 800m以内の店舗のレコード を図 10の被検索対象情報群から取得する。次に、被検索対象情報取得手段 12022 は、当該取得したレコードの中から、「検索対象名称情報」の中に「ラーメン」の文字 列を含むレコードを取得する。そして、力かるレコードの一部または全部が被検索対 象情報である。なお、被検索対象情報の検索フローは問わない。つまり、被検索対 象情報取得手段 12022は、先にラーメン屋に該当するレコードを絞り込み、その後 8 00m以内のラーメン屋の被検索対象情報を取得しても良い。また、ラーメン屋のレコ ードである力否かの判断は、「検索対象名称情報」の中に「ラーメン」の文字列を含む か否かにより行なわれたが、図 10の被検索対象情報は、業種の情報 (ラーメン屋、ィ タリャ料理屋、お寿司屋など)を保持しており、当該業種の情報に基づいて、ラーメン 屋のレコードであるか否かが判断されても良い。そして、被検索対象情報取得手段 1
2022は、図 14の被検索対象情報中間表を得る。被検索対象情報中間表は、検索 対象を示すレコードの集合である。
次に、対象情報取得手段 12023は、被検索対象情報取得手段 12022が取得した 図 14の被検索対象情報中間表に基づいて、元情報格納部 1207を検索し、対象情 報を取得する。対象情報とは、図 14の被検索対象情報中間表の各レコードにより特 定される店舗に関する情報である。つまり、対象情報取得手段 12023は、まず、被検 索対象情報中間表の第 1レコードの「くまもと〇〇ラーメン」に関して記載された情報 を、元情報格納部 1207の全ホームページ力も検索する。かかる検索は、以下のアル ゴリズムで行なう。
[0095] つまり、ホームページは、ここでは、 HTML, XML等のタグにより階層化されたデ ータにより記述されている。例えば、ホームページは、 HTMLで記述されている、と する。そして、対象情報取得手段 12023は、ホームページから HTML構造木を構成 する。 HTML構造木は、例えば、図 15に示すような、 HTMLのタグの階層関係を示 す情報である。図 15において、く table>タグの下位にく tr>タグが存在し、 <tr> タグの下位にく td>タグが存在することを示す。く table >タグは、表全体を指定す るタグであり、く tr>タグは、表中の行(レコード)を指定するタグである。また、く td >タグは、セルを指定するタグである。力かる処理を行うのは、各店舗の情報は、 HT MLタグ階層上の同じ階層に記述されて 、ることが極めて多 、からである。
[0096] 次に、対象情報取得手段 12023は、一のホームページ内を検索し、「くまもと〇〇 ラーメン」の住所情報「東京都新宿区 · · ·」、電話番号情報「03— 1122— 3456」のう ち、 1以上の情報を含む文章群を取得する。文章群は、タグに囲まれた情報であり、 対象情報である。そして、対象情報取得手段 12023は、「くまもと〇〇ラーメン」の住 所情報「東京都新宿区…」、電話番号情報「03— 1122— 3456」のうち、 1以上の 情報を含む階層のタグを取得する。ここで、対象情報取得手段 12023は、く (1>タ グに住所情報「東京都新宿区' · ·」を含むタグが存在すると検知したとする。つまり、 対象情報取得手段 12023は、当該一のホームページのく td>タグ内に対象情報が 存在する、と判断する。なお、対象情報取得手段 12023は、 2以上の場所記述 (住 所情報等)が存在するタグを、上記の対象情報が存在するタグとして決定するァルゴ リズムでも良い。そして、対象情報取得手段 12023は、取得した対象情報を一時格 納する。なお、対象情報を 1以上の場所情報 (住所情報、電話番号情報、郵便番号 情報など)を含む文章群としたのは、店舗等の情報は、 1以上の場所情報を含むこと が多いからである。
[0097] 次に、対象情報取得手段 12023は、次のホームページ内を検索し、「くまもと〇〇 ラーメン」の住所情報「東京都新宿区 · · ·」、電話番号情報「03— 1122— 3456」のう ち、 1以上の情報を含む対象情報、および対象情報が存在する階層のタグを取得す る。
[0098] なお、対象情報取得手段 12023は、ホームページ中に、「くまもと〇〇ラーメン」の 住所情報「東京都新宿区…」、電話番号情報「03— 1122— 3456」のうち、 1以上 の情報を含む文章群が存在しなければ、次のホームページの検索処理に移行する。
[0099] このように、対象情報取得手段 12023は、すべてのホームページから、「くまもと〇 〇ラーメン」の住所情報「東京都新宿区 · · ·」、電話番号情報「03— 1122— 3456」 のうち、 1以上の情報 (場所情報)を含む対象情報を取得する。
[0100] 以上の処理を、 2つ目の店舗「ラーメン ABC」、 3つ目の店舗「ラーメン XYZ」に対し ても行い、それぞれの対象情報をすベて一時格納する。なお、例えば、 2つ目の店 舗「ラーメン ABC」の対象情報を検索する場合、 1つ目の店舗情報「くまもと〇〇ラー メン」の対象情報検索処理の際に抽出したタグ (店舗情報が存在するであろうタグ)に 対応する情報を検索し、他のタグに対応する情報は検索としないことにより、ホーム ページにありがちな内容とは無関係な文章 (バナー広告、左右のメニューなど)を除 去することができる。また、対象情報の取得速度が高速化される。 3つ目の店舗「ラー メン XYZ」の対象情報を検索する場合も同様である。なお、最初に、元情報ごとに、 HTML構造木を構成し、場所情報を 2以上含むタグを検索対象のタグとして登録し 、当該登録されたタグに対応する情報のみを対象情報の候補としても良い。
[0101] 以上の処理により、図 16に示す対象情報管理表が得られる。つまり、対象情報取 得手段 12023は、元情報格納部 1207の全ホームページを検索し、「くまもと〇〇ラ 一メン」の対象情報である、 ID「1」から「n」の nの対象情報を取得した。また、対象情 報取得手段 12023は、同様に、「ラーメン ABC」の対象情報である、 ID「n+ l」から「 n+m」の mの対象情報を取得した。さらに、対象情報取得手段 12023は、同様に、「 ラーメン XYZ」の対象情報である、 ID「n+m+ 1」から「n+m+p」の の対象情報を 取得した。
次に、送信情報構成処理の具体的処理について説明する。
[0102] ランキング決定手段 12041は、図 16の対象情報管理表の ID「1」のレコードの「元 情報 URL」の属性値を取得し、当該属性値である URLが図 11の情報ポータル管理 表に存在するか否かを判断する。例えば、図 16の対象情報管理表の ID「1」の元情 報 URL「http : ZZwww.グルメ. co. jp」は、図 11の情報ポータル管理表に存在 するので、ページランクを「高」とする。次に、ランキング決定手段 12041は、図 16の 対象情報管理表の ID「 1」のレコードの「対象情報」の中に電話番号情報を含むか否 かを判断する。ランキング決定手段 12041は、電話番号情報を含めば「1」、含まな ければ「0」として、後述するランキング中間表の属性値「電話番号」をセットする。次 に、ランキング決定手段 12041は、図 16の対象情報管理表の ID「1」のレコードの「 対象情報」の文字数をカウントし、「384」を得る。そして、ランキング決定手段 12041 は、「ID」「検索対象名称情報」「ページランク」「電話番号」「文字数」を有するレコー ドを 1以上有するランキング中間表を構成する。力かるランキング中間表を図 17に示 す。上記の処理により、図 17の ID「1」のレコードが構成された。
[0103] 次に、ランキング決定手段 12041は、図 16の対象情報管理表の ID「2」のレコード の「元情報 URL」の属性値を取得し、当該属性値である URLが図 11の情報ポータ ル管理表に存在するか否かを判断する。対象情報管理表の ID「2」のレコードの元情 報1;1^し「11 :77&1) · · · . com」は図 11の情報ポータル管理表に存在しないの で、ページランクを「低」とする。次に、ランキング決定手段 12041は、図 16の対象情 報管理表の ID「2」のレコードの「対象情報」の中に電話番号情報を含むので、電話 番号「1」とする。次に、ランキング決定手段 12041は、図 16の対象情報管理表の ID 「2」のレコードの「対象情報」の文字数をカウントし、「129」を得る。力かる処理により 、図 17の ID「2」のレコードが構成された。ランキング決定手段 12041は、図 16の対 象情報管理表の ID「3」以降のレコードに対して以上の処理を行い、図 17のランキン グ中間表を得る。
[0104] 次に、ランキング決定手段 12041は、各店舗 (検索対象名称情報)ごとのポイントを 図 17のランキング中間表に基づいて算出する。つまり、ランキング決定手段 12041 は、ページランク「高」の場合は倍数を「1」とし、ページランク「低」の場合は倍数を「0 . 3」とし、電話番号「1」の場合は倍数を「1」とし、電話番号「0」の場合は倍数を「0. 5 」とする。そして、ランキング決定手段 12041は、「文字数」をページランクの倍数、電 話番号の倍数に掛けてポイントを算出する。そして、ランキング決定手段 12041は、 ポイントを四捨五入により整数にする、とする。
[0105] 具体的には、ランキング決定手段 12041は、「くまもと〇〇ラーメン」のポイントを「3
84 X 1 X 1 + 129 X 0. 3 X 1 H h 291 X 1 X 1」の式により算出する。同様に、ラ ンキング決定手段 12041は、「ラーメン ABC」と「ラーメン 丫∑」のポイントを算出する 。その結果、ランキング決定手段 12041は、「くまもと〇〇ラーメン」のポイント「2522 」、「ラーメン ABC」ポイント「1529」、「ラーメン XYZ」のポイント「4211」と算出した、と する。なお、ポイント算出アルゴリズムは種々あり、他の算出式によりポイントを算出し ても良いことは言うまでもない。ただし、ポイント算出において、ページランクと電話番 号の有無を考慮することは好適である。ホームページの信頼性を加味した評価が可 能となるからである。
[0106] 次に、要約情報取得処理について説明する。まず、要約手段 12043は、 1番目の 検索対象「くまもと〇〇ラーメン」のすベての対象情報(図 16の ID「1」から ID「n」まで の対象情報)を読み出す。単語抽出手段 120431は、すべての対象情報から単語( 名詞)「塩ラーメン」等を抽出する。そして、検索対象毎単語出現回数算出手段 1204 32は、検索対象「くまもと〇〇ラーメン」の全対象情報中における、単語 (名詞)「塩ラ 一メン」の出現回数 (第一出現回数)を、例えば「10」と算出する。次に、同様の処理 により、他の単語の第一出現回数も算出する。
[0107] 次に、要約手段 12043は、 2番目の検索対象「ラーメン ABC」のすべての対象情 報(図 16の ID「n + 1」から「n + m」までの対象情報)を読み出す。単語抽出手段 120 431は、すべての対象情報から単語 (名詞)「特製えび入りラーメン」等を抽出する。 そして、検索対象毎単語出現回数算出手段 120432は、検索対象「ラーメン ABC」 の全対象情報中における、単語 (名詞)「特製えび入りラーメン」の出現回数 (第一出 現回数)を、例えば「8」と算出する。次に、同様の処理により、他の単語の第一出現 回数も算出する。
さら〖こ、 3番目の検索対象「ラーメン XYZ」に対しても同様の処理を行う。
[0108] 次に、単語全出現回数算出手段 120433は、「塩ラーメン」、「特製えび入りラーメン 」等の単語の、全部の検索対象の全対象情報中における出現回数 (第二出現回数) を算出する。そして、割合算出手段 120434は、第一出現回数と第二出現回数の割 合である割合の情報を算出する。さらに、単語リスト作成手段 120435は、「割合」を キーにして、検索対象ごとに、単語をソートする。そして、要約手段 12043は、図 18 の単語リスト管理表を得る。単語リスト管理表は、「検索対象名称情報」「単語」「第一 出現回数」「第二出現回数」「割合」を有するレコードを 1以上保持している。
[0109] 次に、要約手段 12043は、店舗ごとに、割合の大きい単語を含む対象情報中の文 章を、所定のサイズ (例えば、 512byte)になるまで、図 16の対象情報力も文章を取 得する。そして、その際、要約手段 12043は、当該対象情報に対応する元情報 UR Lも取得する。そして、要約手段 12043は、図 19に示す要約情報管理表を得る。要 約情報管理表は、「検索対象名称情報」「要約情報」「元情報 URL」を有するレコード である。「要約情報」は、対象情報から、その店舗の特徴を示す単語が高い割合で出 現する文章を、所定のサイズまで抽出されたものである。
次に、対象情報出力手段 12042は、上記の処理により得られた要約情報等を利用 して、以下の処理により出力する情報を構成する。対象情報出力手段 12042が最終 的に構成する情報の例を図 20に示す。
[0110] つまり、対象情報出力手段 12042は、ランキング 1位の「ラーメン XYZ」の見出しの 情報を構成する。この見出しの情報は、ランキングが 1位であることを示す情報であれ ば何でも良い。ここでは、見出しの情報は、ランキング 1位を示す数字「1」と、検索対 象名称情報 (店舗名)と、ポイントを切り上げした数の星 (ポイント「4211」に対して星 力 つ)を有する。そして、対象情報出力手段 12042は、リンクシンボル情報を構成 する。リンクシンボル情報は、図 20において、「ラーメン ΧΥΖ」の見出し情報の直下に ある「評価 1」「評価 2」などの情報である。そして、「評価 1」等の情報はアンカーであり 、 1つ目の対象情報の元情報の所在を示す URLを保持している。つまり、「評価 1」が 押下されると 1つ目の対象情報の元情報を表示することとなる。具体的には、対象情 報出力手段 12042は、図 19の要約情報管理表のラーメン ΧΥΖの要約情報「ゴマラ 一メンの ΧΥΖ。」から「評価 1」の文字列を構成し、元情報 URL「http : ZZwww.グ ルメ. co. jp」をアンカーの情報として、「評価 1」に付与する。文字列「評価 1」の構成 は、固定文字「評価」に要約情報の順番 (数字)を結合して生成する。そして、図 20 の(1)の領域の情報の構成が完了する。 [0111] 次に、対象情報出力手段 12042は、要約手段 12043が取得した要約情報を、図 2 0の(1)の領域の下に追記する。要約情報もアンカーになっており、要約の対象であ る対象情報に対応する元情報の所在を示す URLが要約情報に付与されて ヽる。そ して、対象情報出力手段 12042は、図 20の(2)の領域を得る。図 20の(2)は、上述 した要約部である。
[0112] 以上の処理を、ランキング 2位の「くまもと〇〇ラーメン」、 3位の「ラーメン ABC」の検 索対象に対して行い、対象情報出力手段 12042は、図 20の出力する情報を得る。 なお、図 20は表示イメージであり、実際は、 HTMLで記述されている。
次に、出力部 1204は、構成した情報(図 20の情報)を、情報端末 11に送信する。 次に、情報端末 11は、図 20の情報 (HTMLで記述された情報)を受信し、当該情 報を解釈実行し、図 20の画面を表示する。
[0113] さらに、情報端末 11のユーザ力 例えば、リンクシンボル情報、ラーメン XYZの「評 価 1」をマウスで押下した、とする。すると、情報端末 11は、ラーメン XYZの「評価 1」 に対応する URL「http : ZZwww.グルメ. co. jp」に対応するページを、情報処理 装置 12に検索に行き、 rhttp : //www.グルメ. co. jp」に対応するページを表示 する。かかる処理は、公知技術による処理であるので詳細な説明を省略する。
[0114] また、情報端末 11のユーザ力 例えば、要約情報「ゴマラーメンの XYZ。」をマウス で押下した、とする。すると、情報端末 11は、要約情報「ゴマラーメンの ΧΥΖ。」に対 応する URL「http : ZZwww.グルメ. co. jp」に対応するページを、情報処理装置 12に検索に行き、「http : ,/www.グノレメ. co. jp」に対応するページを表示する。 力かる処理も、公知技術による処理であるので詳細な説明を省略する。
[0115] 以上、本実施の形態によれば、店舗等の客観的な情報が適切に取得できる。具体 的には、目的とする地点(例えば、 JR山手線新宿など)から、ユーザの行動に合致し た (徒歩 10分など)店舗等の検索が可能となる。また、いわゆるタウンページ等の住 所録情報を用いて店舗等の絞込みを行なうことにより、精度の高い店舗等の検索が 可能となる。また、 HTMLファイル等の構造化された情報カゝら店舗等の情報を検索 する場合に、タグ構造に基づいた情報の分割、検索を行なうことにより、不要な情報 を取り出す確率を減らすことができ、また、高速に必要な情報を取得できる。特に、電 話番号情報、住所情報、郵便番号のうちの 1以上の情報である場所情報を含む階層 レベルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を 取得することにより不要な情報を取り出す確率を減らすことができる。かかる処理によ り、具体的には、例えば、 WEBページの広告の情報など、ユーザが検索したい情報 ではない情報を取得することを防ぎ、良好な検索結果を得ることができる。また、従来 力も用いられてきた距離順や新着順の情報ランキングではなぐ検索対象の店舗等 の記述データ量等に基づいたランキングを行なうことにより、ユーザにとって適切な情 報提示が可能となる。さらに、ページランクや電話番号の有無による情報の信頼性を 加味したランキングを行なうことにより、さらにユーザにとって適切な情報提示が可能 となる。さらに、検索対象の各ページでの単語の出現頻度を考慮して要約情報を構 成することにより、検索対象 (店舗等)に特有の文書部分が切出され、適切な要約情 報が構成できた。
[0116] なお、本実施の形態において、要約手段は、対象情報から単語を抽出する単語抽 出手段と、単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算 出する検索対象毎単語出現回数算出手段と、出現回数に基づいて、対象情報から 各検索対象の要約を取得する要約取得手段を具備した。しかし、要約手段は、対象 情報の先頭、例えば、 100文字を切出すだけの処理でも良い。ただし、上述した単 語の出現回数を考慮した要約方法により、店舗等の検索対象の特徴を良く現した要 約情報を取得できる。
[0117] また、本実施の形態において、対象情報の要約がアンカーとなり、当該アンカーを マウス等で押下した場合に、対象情報の元情報にアクセスし、当該元情報を表示し た力 力かることは必須ではない。つまり、出力部 1204は、アンカーではない要約情 報を出力するだけでも良い。
[0118] また、本実施の形態において、リンクシンボル出力手段 12046は、リンクシンボル 情報(「評価 1」「評価 2」など)を出力したが、リンクシンボル出力手段 12046は必須 ではない。つまり、リンクシンボル情報(「評価 1」「評価 2」など)を出力することは必須 ではない。
また、本実施の形態において、 2以上の検索対象を順位付けするランキング決定手 段 12041は必須ではない。つまり、ランキングしないで、処理した順に店舗情報等を 出力しても良い。
[0119] また、本実施の形態において、ランキング決定手段 12041は、 2以上の検索対象 の対象情報の文字数、または Zおよび当該対象情報に電話番号情報が含まれるか 否力 または Zおよび対象情報が記載されて 、る元情報のページランキングに基づ いて 2以上の検索対象を順位付けした。しかし、かかる処理以外でランキングしても 良い。例えば、ランキング決定手段 12041は、 2以上の検索対象が記載されているホ ームページの数のみに基づいて 2以上の検索対象を順位付けしても良い。
[0120] また、本実施の形態において、検索情報は、検索地点に関する情報である検索地 点情報と、検索対象のグループを特定する情報である対象グループ情報を有した。 対象グループ情報とは、キーワード「ラーメン」等である。しかし、検索情報は、検索地 点情報のみであっても良いし、他の情報 (店舗の広さや営業時間の情報など)を有し ても良い。
また、本実施の形態において、主として、ラーメン屋などの食事どころ(レストラン)を 検索対象としたが、英会話学校や本屋等、サービスや物品を販売、レンタルする店 舗等、何でも良い。
[0121] また、本実施の形態にお!、て、対象情報を取得する元になる情報である元情報は 、階層化されたタグが付された情報であり、対象情報取得部は、一の元情報から複 数の対象情報を取得する場合に、同一の階層レベルの情報を取得した。しかし、対 象情報取得部は、タグの階層情報を用いずに、単純な検索処理等により対象情報を 検索しても良い。なお、タグの階層情報を用いて対象情報を検索した場合に、検索 処理が高速ィ匕されることは言うまでもな 、。
また、本実施の形態において、対象情報取得部は、一の元情報から複数の対象情 報を取得する場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号の うちの 1以上の情報である場所情報を含む階層レベルと同一の階層レベルを決定し 、当該決定した階層レベルの情報を取得した。しかし、対象情報取得部は、一の元 情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番号情報、 住所情報、郵便番号のうちの 1以上の情報である場所情報を含む階層レベルと所定 の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得しても良 い。例えば、図 21 (a)に示すように、 <td>タグに電話番号情報等の場所情報が含 まれている場合に、 <tr>タグ以下 (ここで「以下」とは、階層における下位階層、とい う意味である。)のタグ内の情報を切出して、当該切出した情報を検索対象としても良 い。なお、図 21 (a)のタグ構造を有するホームページは、図 21 (b)のように表の各行 にレストラン等の、ユーザが欲する情報が含まれている。また、例えば、表の各行のあ る属性値として電話番号を有したり、別の属性値として住所を有したりする。
また、例えば、図 22 (a)に示すように、 <td>タグに電話番号情報等の場所情報が 含まれている場合に、 <table>タグ以下のタグ内の情報を切出して、当該切出した 情報を検索対象としても良い。なお、図 22 (a)のタグ構造を有するホームページは、 図 22 (b)のように表のレコード中にレストラン等の、ユーザが欲する情報が含まれて いる。つまり、上述した「場所情報を含む階層レベルと所定の関係にある階層レベル 」とは、「場所情報を含む階層レベル」と同一の階層レベルでも良いし、「場所情報を 含む階層レベル」の一つ上位の階層のレベルでも、二つ上位の階層のレベルでも良 い。
また、本実施の形態において、元情報は、 WEBのホームページであった力 他の 情報であっても良 、ことは言うまでもな 、。
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、こ のソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトゥェ ァを CD— ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明 細書における他の実施の形態においても該当する。なお、本実施の形態における情 報処理装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプ ログラムは、コンピュータに、 2以上の検索対象を特定する情報である検索情報を受 け付ける受付ステップと、前記検索情報により特定される 2以上の検索対象に関する 情報である 2以上の対象情報を 2以上の元情報力 取得する対象情報取得ステップ と、前記 2以上の検索対象の対象情報を出力する出力ステップを実行させるための プログラムである。また、前記出力ステップは、前記 2以上の対象情報を要約し、 2以 上の要約情報を取得する要約ステップと、前記 2以上の要約情報を出力する要約情 報出力ステップを具備しても良い。また、前記要約ステップは、前記対象情報から単 語を抽出する単語抽出ステップと、前記単語抽出ステップで抽出した各単語におけ る、検索対象毎の出現回数を算出する検索対象毎単語出現回数算出ステップと、前 記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要約 取得ステップを具備しても良い。また、前記要約ステップは、前記単語抽出ステップ で抽出した各単語における、全部の検索対象の全対象情報中の出現回数を算出す る単語全出現回数算出ステップと、前記検索対象毎単語出現回数算出ステップで算 出した検索対象毎の出現回数と前記単語全出現回数算出ステップで算出した全対 象情報中の出現回数との割合を算出する割合算出ステップと、前記割合算出ステツ プで算出した割合が高い単語から並べて、検索対象毎の単語リストを作成する単語 リスト作成ステップをさらに具備し、前記要約取得ステップは、前記検索対象毎の単 語リストに基づいて、前記対象情報から各検索対象の要約情報を取得しても良い。
[0123] さらに、前記対象情報取得ステップにおいて、対象情報が記載された情報の所在 を示す情報であるリンク情報も取得し、前記受付ステップにおいて、前記要約情報に 対する指示である要約情報選択指示をも受け付け、前記受付ステップで要約情報選 択指示を受け付けた場合に、前記要約情報選択指示に対応する要約情報の元にな る対象情報が記載された元情報のリンク情報に基づ 、て、当該元情報を取得する元 情報取得ステップをさらに実行させ、前記出力ステップは、前記元情報取得ステップ で取得した元情報をも出力する元情報出力ステップをも具備しても良い。
[0124] また、上記プログラムにお 、て、前記対象情報取得ステップで、対象情報が記載さ れた情報の所在を示す情報であるリンク情報も取得し、前記出力ステップは、前記リ ンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル出カス テツプをさらに具備し、前記受付ステップは、前記リンクシンボル情報に対する指示で あるリンクシンボル選択指示をも受け付け、前記受付ステップにお 、てリンクシンボル 選択指示を受け付けた場合に、前記指示されたリンクシンボル情報に対応するリンク 情報に基づ 、て、当該リンク情報が示す対象情報が記載された情報である元情報を 取得する元情報取得ステップをさらに具備し、前記出力ステップにおいて、前記元情 報取得ステップで取得した元情報をも出力する元情報出力ステップをも具備する構 成でも良い。
[0125] また、上記出力ステップにおいて、前記 2以上の検索対象の対象情報に基づいて、 前記 2以上の検索対象を順位付けするランキング決定ステップをさらに具備し、前記 ランキング決定ステップの順位付けに基づ 、て、前記 2以上の検索対象の対象情報 または Zおよび要約情報を出力しても良い。
[0126] また、ランキング決定ステップにおいて、前記 2以上の検索対象の対象情報の文字 数、または/および当該対象情報に電話番号情報が含まれる力否か、または/およ び対象情報が記載されて!、る元情報のページランキングに基づ!、て前記 2以上の検 索対象を順位付けしても良 、。
上記の検索情報は、検索地点に関する情報である検索地点情報と、検索対象のグ ループを特定する情報である対象グループ情報を有することが好適である。
[0127] また、検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番 号を示す情報である電話番号情報と、検索対象の住所を示す情報である住所情報 を有する被検索対象情報を 1以上有する被検索対象情報群を格納しており、前記対 象情報取得ステップにおいて、前記検索情報に基づいて、被検索対象情報の一部 または全部を取得する被検索対象情報取得ステップと、前記被検索対象情報取得ス テツプで取得した被検索対象情報の一部または全部に基づいて、前記検索情報に より特定される 2以上の検索対象の対象に関する情報である対象情報を取得する対 象情報取得ステップを具備しても良 、。
[0128] また、検索情報は、さらに検索地点情報が示す検索地点力 の検索範囲を特定す る情報である検索範囲情報を含み、前記被検索対象情報取得ステップは、前記検索 情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲情報に基 づいて、 1以上の被検索対象情報を選択し、当該選択した被検索対象情報の一部ま たは全部を取得しても良 ヽ。
[0129] また、被検索対象情報取得ステップにお 、て、前記検索情報が有する検索地点情 報の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該 2つの経緯度から 前記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の 間の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致す るか否かを判断することにより、 1以上の被検索対象情報を選択し、当該選択した被 検索対象情報の一部または全部を取得しても良い。
[0130] また、前記対象情報を取得する元になる情報である元情報は、階層化されたタグが 付された情報であり、前記対象情報取得ステップにおいて、一の元情報から複数の 対象情報を取得する場合に、同一の階層レベルの情報を取得することが好適である
[0131] また、対象情報取得ステップにおいて、一の元情報から複数の対象情報を取得す る場合に、一の元情報を検索し、電話番号情報、住所情報、郵便番号のうちの 1以 上の情報である場所情報を含む階層レベルを決定し、当該決定した階層レベルの 情報を取得しても良い。
また、対象情報取得ステップにおいて、場所情報を 2以上含む階層レベルを決定し 、当該決定した階層レベルの情報を取得しても良い。
[0132] なお、上記プログラムにお 、て、情報を送信する送信ステップや、情報を受信する 受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップに おけるモデムやインターフェースカードなどで行われる処理 (ノヽ一ドウエアでしか行わ れな 、処理)は含まれな!/、。
[0133] また、上記各実施の形態において、各処理 (各機能)は、単一の装置 (システム)に よって集中処理されることによって実現されてもよぐあるいは、複数の装置によって 分散処理されることによって実現されてもよい。つまり、 1以上の装置により、上記した 処理の方法が実現されれば良い。具体的には、例えば、情報処理装置 12は、被検 索対象情報群格納手段 12021を保持せず、他の装置が被検索対象情報群格納手 段 12021を保持していても良い。かかる場合、情報処理装置 12は、当該他の装置を 検索して、被検索対象情報を取得する。
[0134] また、上記情報処理システムにおいて、情報端末 11と情報処理装置 12がーの装 置で実現されていても良い。かかる場合、情報処理装置 12がユーザ入力受付部 11 01を保持し、出力部 1204は、ディスプレイに情報を表示したり、スピーカーで音声 出力したり等の処理を行う。
また、上記各実施の形態において、一の装置に存在する 2以上の通信手段 (情報 送信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。 本発明は、以上の実施の形態に限定されることなぐ種々の変更が可能であり、そ れらも本発明の範囲内に包含されるものであることは言うまでもない。
産業上の利用可能性
[0135] 以上のように、本発明にかかる情報処理装置は、店舗等の客観的な情報が適切に 出力できるという効果を有し、例えば、 WEBにおけるサーチエンジンを有するサーバ 装置等として有用である。
図面の簡単な説明
[0136] [図 1]実施の形態における情報処理システムの概念図
[図 2]同情報処理システムのブロック図
[図 3]同情報端末の動作について説明するフローチャート
[図 4]同情報処理装置の動作について説明するフローチャート
[図 5]同対象情報取得処理について説明するフローチャート
[図 6]同送信情報構成処理について説明するフローチャート
[図 7]同ランキング処理について説明するフローチャート
[図 8]同要約情報取得処理について説明するフローチャート
[図 9]同ホームページの例を示す図
[図 10]同被検索対象情報群を示す図
[図 11]同情報ポータル管理表を示す図
[図 12]同入力画面例を示す図
[図 13]同要求情報を示す図
[図 14]同被検索対象情報中間表を示す図
圆 15]同 HTML構造木を示す図
[図 16]同対象情報管理表を示す図
[図 17]同ランキング中間表を示す図
[図 18]同単語リスト管理表を示す図
[図 19]同要約情報管理表を示す図
[図 20]同出力する情報の例を示す図 [図 21]同 HTML構造木を示す図
[図 22]同 HTML構造木を示す図 符号の説明
11 情報端末
12 情報処理装置
13 情報格納装置
1101 ユーザ入力受付部
1102 要求送信部
1103 情報受信部
1104 情報出力部
1201 受付部
1202 対象情報取得部
1203 元情報取得部
1204 出力部
1205 元情報受信部
1206 元情報蓄積部
1207 元情報格納部
1301 元情報格納部
1302 元情報送信部
12021 被検索対象情報群格納手段
12022 被検索対象情報取得手段
12023 対象情報取得手段
12041 ランキング決定手段
12042 対象情報出力手段
12043 要約手段
12044 要約情報出力手段
12045 元情報出力手段
12046 リンクシンボル出力手段 120431 単語抽出手段
120432 検索対象毎単語出現回数算出手段
120433 単語全出現回数算出手段
120434 割合算出手段
120435 単語リスト作成手段

Claims

請求の範囲
[1] 2以上の検索対象を特定する情報である検索情報を受け付ける受付部と、
前記検索情報により特定される 2以上の検索対象に関する情報である 2以上の対象 情報を 2以上の元情報から取得する対象情報取得部と、
前記 2以上の検索対象の対象情報を出力する出力部を具備する情報処理装置。
[2] 前記出力部は、
前記 2以上の対象情報を要約し、 2以上の要約情報を取得する要約手段と、 前記 2以上の要約情報を出力する要約情報出力手段を具備する請求項 1記載の情 報処理装置。
[3] 前記要約手段は、
前記対象情報から単語を抽出する単語抽出手段と、
前記単語抽出手段が抽出した各単語における、検索対象毎の出現回数を算出する 検索対象毎単語出現回数算出手段と、
前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要 約取得手段を具備する請求項 2記載の情報処理装置。
[4] 前記要約手段は、
前記単語抽出手段が抽出した各単語における、全部の検索対象の全対象情報中の 出現回数を算出する単語全出現回数算出手段と、
前記検索対象毎単語出現回数算出手段が算出した検索対象毎の出現回数と前記 単語全出現回数算出手段が算出した全対象情報中の出現回数との割合を算出する 割合算出手段と、
前記割合算出手段が算出した割合が高い単語から並べて、検索対象毎の単語リスト を作成する単語リスト作成手段をさらに具備し、
前記要約取得手段は、
前記検索対象毎の単語リストに基づいて、前記対象情報から各検索対象の要約情 報を取得する請求項 3記載の情報処理装置。
[5] 前記対象情報取得部は、対象情報が記載された元情報の所在を示す情報であるリ ンク情報も取得し、 前記受付部は、前記要約情報に対する指示である要約情報選択指示をも受け付け 前記受付部が要約情報選択指示を受け付けた場合に、
前記要約情報選択指示に対応する要約情報の元になる対象情報が記載された元情 報のリンク情報に基づいて、当該元情報を取得する元情報取得部をさらに具備し、 前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段 をも具備する請求項 2記載の情報処理装置。
[6] 前記対象情報取得部は、対象情報が記載された元情報の所在を示す情報であるリ ンク情報も取得し、
前記出力部は、
前記リンク情報に対応する情報であるリンクシンボル情報を出力するリンクシンボル 出力手段をさらに具備し、
前記受付部は、前記リンクシンボル情報に対する指示であるリンクシンボル選択指示 をも受け付け、
前記受付部がリンクシンボル選択指示を受け付けた場合に、
前記指示されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情 報が示す対象情報が記載された情報である元情報を取得する元情報取得部をさら に具備し、
前記出力部は、前記元情報取得部が取得した元情報をも出力する元情報出力手段 をも具備する請求項 1記載の情報処理装置。
[7] 前記出力部は、
前記 2以上の検索対象の対象情報に基づいて、前記 2以上の検索対象を順位付け するランキング決定手段をさらに具備し、
前記ランキング決定手段の順位付けに基づ!/、て、前記 2以上の検索対象の対象情 報を出力する請求項 1記載の情報処理装置。
[8] 前記ランキング決定手段は、
前記 2以上の検索対象の対象情報の文字数、または Zおよび当該対象情報に電話 番号情報が含まれる力否力 または Zおよび対象情報が記載されて 、る元情報のぺ ージランキングに基づいて前記 2以上の検索対象を順位付けする請求項 7記載の情 報処理装置。
[9] 前記対象情報取得部は、
検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示 す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有す る被検索対象情報を 1以上有する被検索対象情報群を格納している被検索対象情 報群格納手段と、
前記検索情報に基づ!、て、前記被検索対象情報群格納手段から被検索対象情報 の一部または全部を取得する被検索対象情報取得手段と、
前記被検索対象情報取得手段が取得した被検索対象情報の一部または全部に基 づいて、前記検索情報により特定される 2以上の検索対象の対象に関する情報であ る対象情報を取得する対象情報取得手段を具備する請求項 1記載の情報処理装置
[10] 前記検索情報は、
さらに検索地点情報が示す検索地点からの検索範囲を特定する情報である検索範 囲情報を含み、
前記被検索対象情報取得手段は、
前記検索情報が有する検索地点情報と前記検索対象の住所情報と前記検索範囲 情報に基づ!、て、前記被検索対象情報群格納手段から 1以上の被検索対象情報を 選択し、当該選択した被検索対象情報の一部または全部を取得する請求項 9記載 の情報処理装置。
[11] 前記被検索対象情報取得手段は、
前記検索情報が有する検索地点情報の経緯度と、前記検索対象の住所情報の経緯 度を取得し、当該 2つの経緯度から前記検索地点情報が示す検索地点と前記住所 情報が示す前記検索対象の地点の間の距離を算出し、当該距離に基づいて、前記 検索範囲情報が示す条件に合致するか否かを判断することにより、前記被検索対象 情報群格納手段から 1以上の被検索対象情報を選択し、当該選択した被検索対象 情報の一部または全部を取得する 請求項 10記載の情報処理装置。
[12] 前記対象情報を取得する元になる情報である元情報は、階層化されたタグが付され た情報であり、
前記対象情報取得部は、
一の元情報から複数の対象情報を取得する場合に、同一の階層レベルの情報を取 得する請求項 1記載の情報処理装置。
[13] 前記対象情報取得部は、
一の元情報から複数の対象情報を取得する場合に、一の元情報を検索し、電話番 号情報、住所情報、郵便番号のうちの 1以上の情報である場所情報を含む階層レべ ルと所定の関係にある階層レベルを決定し、当該決定した階層レベルの情報を取得 する請求項 12記載の情報処理装置。
[14] 前記対象情報取得部は、
場所情報を 2以上含む階層レベルを決定し、当該決定した階層レベルの情報を取得 する請求項 13記載の情報処理装置。
[15] コンピュータに、
2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、 前記検索情報により特定される 2以上の検索対象に関する情報である 2以上の対象 情報を 2以上の元情報から取得する対象情報取得ステップと、
前記 2以上の検索対象の対象情報を出力する出力ステップを実行させるためのプロ グラム。
[16] 前記出力ステップは、
前記 2以上の対象情報を要約し、 2以上の要約情報を取得する要約ステップと、 前記 2以上の要約情報を出力する要約情報出力ステップを具備する請求項 15記載 のプログラム。
[17] 前記要約ステップは、
前記対象情報力 単語を抽出する単語抽出ステップと、
前記単語抽出ステップで抽出した各単語における、検索対象毎の出現回数を算出 する検索対象毎単語出現回数算出ステップと、 前記出現回数に基づいて、前記対象情報から各検索対象の要約情報を取得する要 約取得ステップを具備する請求項 16記載のプログラム。
[18] 前記要約ステップは、
前記単語抽出ステップで抽出した各単語における、全部の検索対象の全対象情報 中の出現回数を算出する単語全出現回数算出ステップと、
前記検索対象毎単語出現回数算出ステップで算出した検索対象毎の出現回数と前 記単語全出現回数算出ステップで算出した全対象情報中の出現回数との割合を算 出する割合算出ステップと、
前記割合算出ステップで算出した割合が高い単語から並べて、検索対象毎の単語リ ストを作成する単語リスト作成ステップをさらに具備し、
前記要約取得ステップは、前記検索対象毎の単語リストに基づいて、前記対象情報 から各検索対象の要約情報を取得する請求項 17記載のプログラム。
[19] 前記対象情報取得ステップにお!/、て、
対象情報が記載された元情報の所在を示す情報であるリンク情報も取得し、 前記受付ステップにお 、て、
前記要約情報に対する指示である要約情報選択指示をも受け付け、
前記受付ステップで要約情報選択指示を受け付けた場合に、前記要約情報選択指 示に対応する要約情報の元になる対象情報が記載された元情報のリンク情報に基 づ 、て、当該元情報を取得する元情報取得ステップをコンピュータにさらに実行させ 前記出力ステップは、
前記元情報取得ステップで取得した元情報をも出力する元情報出力ステップをも具 備する請求項 15記載のプログラム。
[20] 前記対象情報取得ステップで、対象情報が記載された元情報の所在を示す情報で あるリンク情報も取得し、
前記出力ステップは、前記リンク情報に対応する情報であるリンクシンボル情報を出 力するリンクシンボル出力ステップをさらに具備し、
前記受付ステップは、前記リンクシンボル情報に対する指示であるリンクシンボル選 択指示をも受け付け、
前記受付ステップにお 、てリンクシンボル選択指示を受け付けた場合に、前記指示 されたリンクシンボル情報に対応するリンク情報に基づいて、当該リンク情報が示す 対象情報が記載された情報である元情報を取得する元情報取得ステップをコンビュ ータにさらに実行させ、
前記出力ステップにおいて、前記元情報取得ステップで取得した元情報をも出力す る元情報出力ステップをも具備する請求項 15記載のプログラム。
[21] 前記出力ステップにおいて、
前記 2以上の検索対象の対象情報に基づいて、前記 2以上の検索対象を順位付け するランキング決定ステップをさらに具備し、
前記ランキング決定ステップの順位付けに基づ 、て、前記 2以上の検索対象の対象 情報または Zおよび要約情報を出力する請求項 15記載のプログラム。
[22] 前記ランキング決定ステップにおいて、前記 2以上の検索対象の対象情報の文字数 、または Zおよび当該対象情報に電話番号情報が含まれる力否力、または Zおよび 対象情報が記載されて 、る元情報のページランキングに基づ 、て前記 2以上の検索 対象を順位付けする請求項 21記載のプログラム。
[23] 検索対象の名称を示す情報である検索対象名称情報と、検索対象の電話番号を示 す情報である電話番号情報と、検索対象の住所を示す情報である住所情報を有す る被検索対象情報を 1以上有する被検索対象情報群を格納しており、
前記対象情報取得ステップは、
前記検索情報に基づ!、て、被検索対象情報の一部または全部を取得する被検索対 象情報取得ステップと、
前記被検索対象情報取得ステップで取得した被検索対象情報の一部または全部に 基づいて、前記検索情報により特定される 2以上の検索対象の対象に関する情報で ある対象情報を取得する対象情報取得サブステップを具備する請求項 15記載のプ ログラム。
[24] 検索情報は、さらに検索地点情報が示す検索地点からの検索範囲を特定する情報 である検索範囲情報を含み、 前記被検索対象情報取得ステップは、前記検索情報が有する検索地点情報と前記 検索対象の住所情報と前記検索範囲情報に基づいて、 1以上の被検索対象情報を 選択し、当該選択した被検索対象情報の一部または全部を取得する請求項 23記載 のプログラム。
[25] 前記被検索対象情報取得ステップにお!、て、前記検索情報が有する検索地点情報 の経緯度と、前記検索対象の住所情報の経緯度を取得し、当該 2つの経緯度から前 記検索地点情報が示す検索地点と前記住所情報が示す前記検索対象の地点の間 の距離を算出し、当該距離に基づいて、前記検索範囲情報が示す条件に合致する か否かを判断することにより、 1以上の被検索対象情報を選択し、当該選択した被検 索対象情報の一部または全部を取得する請求項 24記載のプログラム。
[26] 前記対象情報を取得する元になる情報である元情報は、階層化されたタグが付され た情報であり、
前記対象情報取得ステップにお!、て、一の元情報から複数の対象情報を取得する 場合に、同一の階層レベルの情報を取得する請求項 15記載のプログラム。
[27] 2以上の検索対象を特定する情報である検索情報を受け付ける受付ステップと、 前記検索情報により特定される 2以上の検索対象に関する情報である 2以上の対象 情報を 2以上の元情報から取得する対象情報取得ステップと、
前記 2以上の検索対象の対象情報を出力する出力ステップを具備する情報処理方 法。
[28] 前記出力ステップは、
前記 2以上の対象情報を要約し、 2以上の要約情報を取得する要約ステップと、 前記 2以上の要約情報を出力する要約情報出力ステップを具備する請求項 27記載 の情報処理方法。
PCT/JP2005/011786 2004-07-16 2005-06-28 情報処理装置およびプログラム WO2006008919A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006524541A JP4035623B2 (ja) 2004-07-16 2005-06-28 情報処理装置およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-209780 2004-07-16
JP2004209780 2004-07-16

Publications (1)

Publication Number Publication Date
WO2006008919A1 true WO2006008919A1 (ja) 2006-01-26

Family

ID=35785042

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/011786 WO2006008919A1 (ja) 2004-07-16 2005-06-28 情報処理装置およびプログラム

Country Status (2)

Country Link
JP (1) JP4035623B2 (ja)
WO (1) WO2006008919A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040869A (ja) * 2006-08-08 2008-02-21 Pioneer Electronic Corp 地点情報評価装置、地点情報評価プログラム
WO2008142791A1 (ja) * 2007-05-24 2008-11-27 Fujitsu Limited 差分算出プログラム、差分算出装置および差分算出方法
CN104715000A (zh) * 2013-12-17 2015-06-17 国际商业机器公司 用于支持评价分析的装置和方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207458A (ja) * 1999-01-08 2000-07-28 Recruit Co Ltd 商品情報サ―ビスシステム
JP2001357035A (ja) * 2000-06-13 2001-12-26 Open Door:Kk コンテンツ評価・検索システム
JP2003157254A (ja) * 2001-11-20 2003-05-30 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2003167990A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd 商品情報収集システム及び方法
JP2003271670A (ja) * 2002-03-19 2003-09-26 Mitsubishi Electric Corp 情報収集装置、情報収集方法及びプログラム
JP2004185572A (ja) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 口コミ情報解析方法及び装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000207458A (ja) * 1999-01-08 2000-07-28 Recruit Co Ltd 商品情報サ―ビスシステム
JP2001357035A (ja) * 2000-06-13 2001-12-26 Open Door:Kk コンテンツ評価・検索システム
JP2003157254A (ja) * 2001-11-20 2003-05-30 Just Syst Corp 情報処理装置、情報処理方法、及び情報処理プログラム
JP2003167990A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd 商品情報収集システム及び方法
JP2003271670A (ja) * 2002-03-19 2003-09-26 Mitsubishi Electric Corp 情報収集装置、情報収集方法及びプログラム
JP2004185572A (ja) * 2002-12-06 2004-07-02 Nippon Telegr & Teleph Corp <Ntt> 口コミ情報解析方法及び装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040869A (ja) * 2006-08-08 2008-02-21 Pioneer Electronic Corp 地点情報評価装置、地点情報評価プログラム
WO2008142791A1 (ja) * 2007-05-24 2008-11-27 Fujitsu Limited 差分算出プログラム、差分算出装置および差分算出方法
JPWO2008142791A1 (ja) * 2007-05-24 2010-08-05 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
JP4957796B2 (ja) * 2007-05-24 2012-06-20 富士通株式会社 差分算出プログラム、差分算出装置および差分算出方法
CN104715000A (zh) * 2013-12-17 2015-06-17 国际商业机器公司 用于支持评价分析的装置和方法
US10185915B2 (en) 2013-12-17 2019-01-22 International Business Machines Corporation Analysis of evaluations from internet media

Also Published As

Publication number Publication date
JP4035623B2 (ja) 2008-01-23
JPWO2006008919A1 (ja) 2008-05-01

Similar Documents

Publication Publication Date Title
JP4909334B2 (ja) サービス提案装置及びその方法、サービス提案システム、ユーザのお気に入りベースに基づくサービス提案装置及びその方法
US8001135B2 (en) Search support apparatus, computer program product, and search support system
US20050004903A1 (en) Regional information retrieving method and regional information retrieval apparatus
JP5769327B2 (ja) データベース構築装置、商標侵害検知装置、データベース構築方法、およびプログラム
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
US20200043074A1 (en) Apparatus and method of recommending items based on areas
JP2007233862A (ja) サービス検索システム及びサービス検索方法
KR101671374B1 (ko) 키워드 추천 장치와 방법 및 키워드 지식베이스 구축 방법
US20130304370A1 (en) Method and apparatus to provide location information
JP2010181966A (ja) レコメンド情報評価装置およびレコメンド情報評価方法
JP4035623B2 (ja) 情報処理装置およびプログラム
JP5185891B2 (ja) コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
JP6639040B2 (ja) 情報検索装置及びプログラム
JP3984263B2 (ja) 地図情報システム連動サーチエンジンサーバーシステム。
JP4505389B2 (ja) 広告コンテンツ送信システム、広告コンテンツ送信方法
JP5144185B2 (ja) 情報検索システム及び情報検索方法
JP4708288B2 (ja) サービス連携サーバ、方法、システム、プログラム、及び、記録媒体
JP2007048328A (ja) 情報処理装置、情報処理方法およびプログラム
JP2001236368A (ja) 情報通信端末、サーバ装置およびそれらを接続した情報通信システム
JP5084859B2 (ja) 情報処理装置、データ抽出方法、及びプログラム
JP2009122738A (ja) 情報処理装置、情報処理方法、およびプログラム
KR20200125412A (ko) 여행 속성 언어 개인화 방법 및 장치
JP2005099964A (ja) 検索分類システム、検索分類サーバ、プログラムおよび記録媒体
JP2007102635A (ja) Blogコミュニティ推薦方法及びシステム及びプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2006524541

Country of ref document: JP

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase