WO2018186235A1 - 場所人気度推定システム - Google Patents

場所人気度推定システム Download PDF

Info

Publication number
WO2018186235A1
WO2018186235A1 PCT/JP2018/012457 JP2018012457W WO2018186235A1 WO 2018186235 A1 WO2018186235 A1 WO 2018186235A1 JP 2018012457 W JP2018012457 W JP 2018012457W WO 2018186235 A1 WO2018186235 A1 WO 2018186235A1
Authority
WO
WIPO (PCT)
Prior art keywords
facility
popularity
posted
data
unit
Prior art date
Application number
PCT/JP2018/012457
Other languages
English (en)
French (fr)
Inventor
健 榎園
佑介 深澤
悠 菊地
桂一 落合
慎 石黒
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Priority to JP2019511171A priority Critical patent/JP6666521B2/ja
Priority to US16/346,387 priority patent/US20190259073A1/en
Publication of WO2018186235A1 publication Critical patent/WO2018186235A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals
    • H04W4/185Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals by embedding added-value information into content, e.g. geo-tagging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • H04W4/21Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications

Definitions

  • the present invention relates to a location popularity estimation system for estimating the popularity of a location.
  • Patent Document 1 As described in Patent Document 1, it has been conventionally proposed to rank facilities according to their popularity.
  • the rank is set based on the number of blocks in which the target area is divided.
  • the rank of the location where the restaurant exists is updated.
  • the degree of popularity to be estimated indicates how popular the facility visited by the user is, that is, how many users are visiting the facility.
  • the position information data usually includes an error
  • only a certain range of information for example, information on the number of people in mesh units
  • Patent Document 1 it is conceivable to estimate the popularity of a facility by correcting the number of people in mesh units using data posted by a user. For example, out of the text that is the posted data, the text in which the name of the facility is described is counted for each facility, and it is estimated that the facility with the larger number of the text is the more popular facility.
  • the popularity of the facility is increased. For example, when a facility is taken up in the news of an accident or incident, the number of texts describing the name of the facility may be enormous. In such a case, the popularity of the facility cannot be estimated appropriately.
  • the present invention has been made in view of the above, and an object thereof is to provide a place popularity estimation system capable of appropriately estimating the popularity of a place such as a facility in consideration of a user visit. .
  • a place popularity estimation system is a place popularity estimation system that estimates the popularity of a place, and acquires post data posted by a user.
  • the post data acquisition unit and the post data acquired by the post data acquisition unit are related to the location to be estimated and indicate that the user who posted the post data has visited the location to be estimated
  • a post data determination unit that determines whether or not, a count unit that counts post data for a place to be estimated according to a determination by the post data determination unit, and a number of people that are located in an area including the place to be estimated It is indicated by the number information acquisition unit for acquiring information, the value counted by the count unit, and the number information acquired by the number information acquisition unit. Based on the number includes a popularity estimator for estimating the popularity of the estimated target location, and an output unit for outputting information indicating the popularity estimated by popularity estimating unit.
  • post data is related to a place to be estimated, and indicates that a user who posted the post data has visited the place to be estimated A determination is made as to whether it is a thing.
  • Post data corresponding to the determination is counted, and the popularity of the estimation target place is estimated based on the counted value and the number of people information. Therefore, the posted data is appropriately considered in estimating the popularity. That is, according to the place popularity degree estimation system according to the embodiment of the present invention, the popularity degree of a place such as a facility can be appropriately estimated in consideration of the visit of the user.
  • the posted data is appropriately taken into account when estimating the popularity, it is possible to appropriately estimate the popularity of a place such as a facility in consideration of a user visit. it can.
  • FIG. 1 shows a server 10 that is a place popularity estimation system according to the present embodiment.
  • the server 10 is a system (apparatus) that estimates the popularity of a place.
  • the places whose popularity is to be estimated are facilities such as stores, leisure facilities, and tourist facilities.
  • the location whose popularity is to be estimated may be any location whose location can be specified, such as a place other than a facility, such as a tourist spot other than a facility and a POI (Point of Interest). Also good.
  • the degree of popularity indicates how popular the user visits the facility, that is, how many users visit the facility.
  • the estimated popularity may be used when providing facility information to a user, for example. Specifically, based on the popularity ranking of facilities, when a facility information search is performed by the user, the facility with the highest popularity is displayed at the top, or the facility with a higher popularity is recommended to nearby users. You can do it.
  • the server 10 is connected to a network such as the Internet, and can communicate with other devices.
  • the server 10 transmits / receives information used for estimating the popularity of the facility to / from other devices. What kind of information is exchanged with what kind of device will be described later.
  • the server 10 includes a storage unit 11, a post data acquisition unit 12, a post data determination unit 13, a count unit 14, a number information acquisition unit 15, a popularity estimation unit 16, and an output unit. 17.
  • the storage unit 11 is a functional unit that stores information necessary for processing in the server 10. What information is stored in the storage unit 11 will be described later.
  • the post data acquisition unit 12 is a functional unit that acquires post data posted by the user.
  • the post data acquired by the post data acquisition unit 12 is data including text posted (transmitted) to a microblog from user terminals that are mobile communication terminals of an unspecified number of users, for example.
  • the posting data may include position information indicating a position where the text is posted, that is, a geotag.
  • the position information is information indicating the position of the user terminal when the text is posted, for example.
  • the position information is information indicating the latitude and longitude of the position of the user terminal acquired by the GPS function in the user terminal, for example.
  • the microblog service is provided by a microblog server.
  • the storage unit 11 stores post data.
  • the storage unit 11 holds post data in a microblog management table.
  • FIG. 2 shows a microblog management table.
  • One row (record) is information about one post data.
  • the microblog management table stores associated information in the text_id, user_id, time_stamp, lat, lng, and text fields.
  • Information stored in the text_id column is an identifier for identifying posted text (post data).
  • the information stored in the user_id column is an identifier for identifying the user who posted the text.
  • the identifier is an identifier used for identifying a user in a microblog, for example.
  • the information stored in the “time_stamp” column is information indicating the time when the text is posted, specifically, the date, time, minute, and second when the text is posted.
  • the information stored in the lat and lng fields is position information indicating the position where the text is posted, specifically, information indicating latitude and longitude, respectively.
  • the position information may not be included in the posting data depending on the setting when posting is performed.
  • the position information is not included in the posting data in the second and fourth lines of the microblog management table shown in FIG.
  • the information stored in the text field is the posted text (character string).
  • the posted text is in Japanese, but the position embodiment of the present invention can be implemented in the same manner as in the present embodiment even if the posted text is not in Japanese.
  • the post data stored in the microblog management table is acquired from the microblog server by the server 10 in advance.
  • the information may be acquired in advance from the microblog server and input to the server 10 by an administrator of the server 10 or the like.
  • the post data acquisition unit 12 reads and acquires a plurality of post data stored in the microblog management table.
  • the post data acquisition unit 12 may acquire only post data in which the time when the text is posted is a preset time zone, for example, a time zone corresponding to the number information described later.
  • the posting data acquisition unit 12 may request posting data from the microblog server and receive and acquire the posting data from the microblog server.
  • the posted data acquisition unit 12 outputs the acquired posted data to the posted data determination unit 13.
  • the posted data determination unit 13 indicates that the posted data acquired by the posted data acquisition unit 12 relates to the estimation target facility and that the user who posted the posted data has visited the estimation target facility. It is a function part which determines whether it is.
  • the post data relating to the facility to be estimated means, for example, that the text of the post data describes the facility.
  • the posted data determination unit 13 determines whether or not the text included in the posted data includes a description according to the facility to be estimated, and determines whether or not the posted data relates to the facility to be estimated. It may be determined.
  • the posted data determination unit 13 may determine whether the user who posted the posted data has visited the estimation target facility based on the text included in the posted data. Alternatively, the posted data determination unit 13 may determine whether the user who posted the posted data has visited the estimation target facility based on the position information included in the posted data.
  • the storage unit 11 stores information used for the determination.
  • the storage unit 11 holds the information in a facility information management table and a visit rule morpheme management table.
  • FIG. 3 shows a facility information management table.
  • the facility information management table is a table that holds information about a facility to be estimated.
  • One row (record) is information about one facility.
  • the facility information management table stores information associated with each of the columns of facility name, mesh_code, lat, and ng.
  • the information stored in the facility name column is a character string that is the facility name of the facility.
  • the information stored in the mesh_code column is an identifier for identifying the mesh including the location of the facility.
  • the mesh is obtained by dividing the area where the facility is provided. Each mesh is, for example, a rectangle having a side of about several tens of meters to several hundreds of meters. For example, the information related to the four facilities in the facility information management table shown in FIG. 3 are all located in the same mesh.
  • Information stored in the lat and lng fields is position information indicating the position of the facility, and specifically, information indicating latitude and longitude, respectively.
  • Fig. 4 shows the visit rule morpheme management table.
  • the visit rule morpheme management table is a table that holds information used to determine whether the user who posted the posted data has visited the facility to be estimated.
  • the visit rule morpheme management table stores information associated with each of the columns of id and visit rule morpheme.
  • the information stored in the id column is an identifier for identifying each piece of information stored in the visit rule morpheme management table.
  • the information stored in the visit rule morpheme column is a character string that is a morpheme used in the above determination.
  • the character string indicates a visit to the user's facility, for example, “go”, “come”, “visit”, “is”, etc., as shown in FIG.
  • Information held in the facility information management table and the visit rule morpheme management table is input to the server 10 in advance by an administrator of the server 10 or the like.
  • the posted data determination unit 13 determines as follows.
  • the post data determination unit 13 inputs post data from the post data acquisition unit 12.
  • the posted data determination unit 13 reads information held in the facility information management table and the visit rule morpheme management table.
  • the posted data determination unit 13 determines for each input posted data.
  • the posted data determination unit 13 performs morphological analysis on the text included in the posted data. Morphological analysis is performed using any conventional method. In the morpheme analysis, the tense of each morpheme may be made current.
  • the posted data determination unit 13 determines whether each morpheme obtained by the morpheme analysis is consistent with the facility name. This coincidence determination is made for the facility names of all the facilities. When the posted data determination unit 13 determines that any morpheme and the facility name match, the posted data determination unit 13 determines that the posted data relates to the facility with the facility name. That is, if the facility name is included in the text, it is determined that the posted data relates to the facility having the facility name. When it is determined that no morpheme matches the facility name, the posted data determination unit 13 determines that the posted data does not relate to any facility.
  • the posted data determination unit 13 determines whether the posted data includes position information (provided). When the posted data determination unit 13 determines that the position information is included in the posted data, the posted data determination unit 13 determines whether the position indicated by the position information is within the mesh of the facility that is supposed to be related to the posted data. .
  • the posted data determination unit 13 stores a correspondence relationship between the latitude and longitude and the mesh in advance, and makes the above determination based on the correspondence relationship.
  • the posted data determination unit 13 determines that the position indicated by the position information included in the posted data is within the facility mesh. That is, in this case, the posted data determination unit 13 determines (classifies) the posted data as having a visit flag. This determination is based on the possibility that the user is visiting the facility when the posting related to the facility is performed and the posted position is within the facility mesh.
  • the posted data determination unit 13 determines that the position indicated by the position information included in the posted data is not within the facility mesh, the posted data is that the user who posted the posted data visited the facility Is not determined. That is, in this case, the posted data determination unit 13 determines (classifies) the posted data as having no visit flag.
  • the above determination was made to determine whether or not the position related to the posted data is within the facility mesh. For example, as shown below, the distance between the position related to the posted data and the position of the facility is determined. It is good also as making a judgment based on.
  • the posted data determination unit 13 calculates the distance between the latitude and longitude indicating the position related to the posted data and the latitude and longitude indicating the position of the facility included in the facility information management table.
  • the posted data determination unit 13 compares the calculated distance with a preset threshold (for example, several meters to several tens of meters). When it is determined by comparison that the distance is equal to or less than the threshold value, the posted data determination unit 13 determines (classifies) the posted data as having a visit flag. When it is determined by comparison that the distance is not equal to or smaller than the threshold value, the posted data determination unit 13 determines (classifies) the posted data as having no visit flag.
  • the posted data determination unit 13 determines whether each morpheme obtained by the morpheme analysis matches the visit rule morpheme. This match determination is performed for all visit rule morphemes. If the posted data determination unit 13 determines that any morpheme and the visit rule morpheme match, the posted data determination unit 13 determines that the posted data indicates that the user who posted the posted data has visited the facility. . That is, in this case, the posted data determination unit 13 determines (classifies) the posted data as having a visit flag. The determination is based on the possibility that the user is visiting the facility when the posting related to the facility is performed and the posted text includes a character string indicating a visit to the facility. .
  • the posted data determination unit 13 determines that none of the morphemes matches the visit rule morpheme, the posted data determination unit 13 does not determine that the posted data indicates that the user who posted the posted data has visited the facility. That is, in this case, the posted data determination unit 13 determines (classifies) the posted data as having no visit flag.
  • Text about post data whose text_id is “textID_0002” is “Tokyo / tourism / de / A / to / first time / coming /! / outlook” by morphological analysis. Stand / kara / no / view / ga / wow /! ”.
  • morpheme “A” which is a facility name. Since the post data does not include position information, it is determined whether or not a morpheme that matches the visit rule morpheme exists in the morpheme.
  • there is a morpheme “coming” which is a visit rule morpheme. Therefore, it is determined that the posted data relates to the facility having the facility name “A” and has a visit flag.
  • the text about the post data whose text_id is “textID_0003” is “A // CM / view / Bad / Go / Look / Wow” by morphological analysis. It becomes.
  • these morphemes there is a morpheme “A” which is a facility name. Since the posted data includes position information, it is determined whether or not the position indicated by the position information (138.00, 34.00) is within the mesh “mesh_A” of the facility with the facility name “A”. Since the position is not in the mesh, it is determined that the post data relates to the facility having the facility name “A” and that there is no visit flag.
  • the post data whose text_id is “textID_0004” is related to the facility with the facility name “B” and has a visit flag, as described above. Determined.
  • the posting data determination unit 13 outputs information indicating the above determination result to the counting unit 14 for each posting data.
  • the posted data determination unit 13 indicates, for posted data related to any facility, information indicating the facility and that the user who posted the posted data has visited the estimation target facility Information indicating whether or not it is determined is output to the count unit 14.
  • the counting unit 14 is a functional unit that counts the posting data for the estimation target facility according to the determination by the posting data determination unit 13.
  • the count unit 14 inputs information indicating the determination result from the posted data determination unit 13.
  • the numbers counted by the counting unit 14 are collected, for example, in the facility and microblog association management table shown in FIG.
  • the facility and microblog association management table stores information associated with the facility name, mesh_code, flg_false, and flg_true fields.
  • the information stored in the column of facility name and mesh_code is a character string that is the facility name of the facility relating to the counted number, and a mesh identifier that includes the position of the facility.
  • the information stored in the flg_false field is the number of posted data determined as having no visit flag among the posted data determined to be related to the facility.
  • the information stored in the flg_true field is the number of posted data determined to have a visit flag among the posted data determined to be related to the facility.
  • the number of flg_true is the number that the user has visited (estimated) after posting the facility.
  • the counting unit 14 outputs information on the facility and microblog association management table shown in FIG.
  • the above number may be the number of users, not the number of posted data (number of posts). That is, even if the same user makes a plurality of postings for which the same determination is made, it counts as 1, not counting a plurality of times. Even if one user makes a post for which the same determination is performed many times, the popularity of the facility can be estimated without considering the number of posts per user.
  • the number information acquisition unit 15 is a functional unit that acquires number information indicating the number of people located in the area including the facility to be estimated.
  • the area is the mesh described above, and the number of persons information is information indicating the number of persons for each mesh and time zone.
  • the storage unit 11 stores the number information.
  • the storage unit 11 holds the number information in the mesh statistical population management table.
  • FIG. 6 shows a mesh statistical population management table.
  • One row (record) is the number of people information for one mesh and one time zone.
  • the mesh statistical population management table stores associated information in the mesh_code, date, time_start, time_end, and population fields.
  • the information stored in the mesh_code column is a mesh identifier related to the number of people information.
  • the information stored in the date, time_start, and time_end fields is information indicating a time zone related to the number information.
  • the information stored in the date column is information indicating the date.
  • Information stored in the fields of time_start and time_end is information indicating the start time and the end time of the time zone, the minute, and the second, respectively.
  • the information stored in the column of population is the number of people in the mesh and the time zone.
  • the number of meshes can be obtained based on information indicating the position of a mobile communication terminal (user terminal) such as a mobile phone, for example. By counting the number of mobile communication terminals for each mesh, the number information of the mesh can be obtained.
  • the data stored in the mesh statistical population management table is acquired in advance from, for example, a server of a mobile communication carrier that provides number information by the server 10. Alternatively, the information may be acquired in advance from the server or the like of the communication carrier by the administrator of the server 10 and input to the server 10.
  • the number information acquisition unit 15 reads and acquires the number information stored in the mesh statistical population management table.
  • the number information acquisition unit 15 may acquire only number information in a preset time zone (for example, the past one hour, one day, one week, one month, etc. from the present time). Further, the number information acquisition unit 15 may request the number information from a telecommunications carrier server or the like, and receive and acquire the number information from the telecommunications carrier server or the like.
  • the number information acquisition unit 15 outputs the acquired number information to the popularity degree estimation unit 16.
  • the popularity estimation unit 16 is a functional unit that estimates the popularity of the facility to be estimated based on the value counted by the count unit 14 and the number of people indicated by the number of people information acquired by the number of people information acquisition unit 15. .
  • the popularity estimation unit 16 weights the number of people indicated by the number of people information acquired by the number of people information acquisition unit 15 according to the value counted by the counting unit 14 to determine the popularity of the facility to be estimated. The score shown may be calculated.
  • the popularity estimation unit 16 may estimate the popularity of the estimation target facility based on the ratio of the value counted by the counting unit 14 for each facility in the mesh that is a region including the estimation target facility. .
  • the popularity estimation unit 16 inputs information from the count unit 14 and the number of people information acquisition unit 15, respectively. Based on the input information, the popularity estimation unit 16 calculates a score indicating the popularity for each facility, and estimates the popularity. The popularity estimation unit 16 calculates a score POP (POI) indicating the popularity of the facility POI by the following formula. In the above formula, P is the number of meshes including the facility to be estimated. The popularity estimation unit 16 calculates P from the number of people indicated by the number of people information. For example, the popularity estimation unit 16 uses the number of people information for one day, and sets the average value of the number of people in the hour unit of the mesh as P.
  • flg_false (POI) and flg_true (POI) are the values of flg_false and flg_true of the facility, respectively.
  • sum (flg_false) is the total sum of the flg_false values of all facilities included in the mesh.
  • sum (flg_true) is the total sum of flg_true values of all facilities included in the mesh.
  • the score POP (POI) is obtained by weighting the number of the meshes with the respective values of flg_false (POI) and flg_true (POI).
  • the score POP (POI) is an index value of the number of people who have visited the facility. As the score POP (POI) is larger, it is considered that more people are visiting, indicating that the facility is highly popular.
  • the facilities in the mesh are the four facilities shown in the facility and microblog association management table in FIG. 5 and the values of flg_false and flg_true for each facility are shown in the table. Further, it is assumed that the average value P of the number of people in the mesh is 200. In this case, the score POP (POI) for each facility is as follows.
  • the number of people information for one day is used, but only the number of people information for a specific time zone may be used. For example, it is good also as not using the number-of-people information of the late-night time zone when the facility (store) is not open.
  • the average value of the number of persons for each time period in a day may be calculated from the number of persons information for a plurality of days (for example, one month), and the score of the facility for each time period may be calculated. That is, the popularity of the facility for each time zone may be estimated.
  • the values of flg_false and flg_true for each facility may be calculated using only the posting data corresponding to the time zone of the number information used for calculating the average number of people.
  • the popularity estimation unit 16 summarizes the calculated scores in, for example, the facility score management table shown in FIG. As shown in FIG. 7, the facility score management table stores information associated with the facility name, mesh_code, and score fields. Information stored in the facility name and mesh_code fields is a character string that is the facility name of the facility related to the calculated score, and a mesh identifier that includes the location of the facility. The information stored in the score column is a calculated score. The popularity estimation unit 16 outputs information of the facility score management table to the output unit 17.
  • the output unit 17 is a functional unit that outputs information indicating the popularity estimated by the popularity estimation unit 16.
  • the output unit 17 inputs information of the facility score management table shown in FIG.
  • the output unit 17 outputs the information of the facility score management table shown in FIG.
  • Information of the facility score management table stored in the storage unit 11 is referred to by a device or a module that provides facility information to the user. Alternatively, the output unit 17 may transmit the information to the device or module.
  • operation of said each function part is performed at the timing when the trigger was input into the server 10 by the administrator of the server 10, etc., or the timing set beforehand, for example. Specifically, it is performed before or when the facility information is provided to the user.
  • the above is the function of the server 10 according to the present embodiment.
  • post data is acquired by the post data acquisition unit 12 (S01).
  • the posting data determination unit 13 determines whether each posting data is related to the facility to be estimated and the presence / absence of a visit flag (S03).
  • the count unit 14 counts according to the determination by the posted data determination unit 13 (S03).
  • the determination (S02) and count (S03) processes will be described in detail with reference to the flowchart of FIG. This process is performed for all post data for each post data.
  • the post data acquisition unit 12 performs morphological analysis on the text included in the post data (S21).
  • the posted data determination unit 13 determines whether there is a morpheme that matches the facility name (S22).
  • the posted data determination unit 13 determines that any morpheme does not match the facility name (NO in S22), it is determined that the posted data does not relate to any facility. In this case, the posting data is not counted, and the processing for the posting data ends.
  • the posted data determination unit 13 determines whether or not the posted data includes position information (provided) (S23). If the posted data determining unit 13 determines that the location information is included in the posted data (YES in S23), then the facility mesh in which the location indicated by the location information is related to the posted data. It is judged whether it is in (S24).
  • the posted data determination unit 13 determines that the position indicated by the position information included in the posted data is within the facility mesh (YES in S24), the posted data is determined (classified) as having a visit flag. The Subsequently, according to the determination, the count unit 14 increments the value of flg_true for the facility by 1 (S31). On the other hand, when the posted data determination unit 13 determines in S24 that the position indicated by the position information included in the posted data is not within the facility mesh (NO in S24), the posted data is not flagged as a visit flag. It is determined (classified) (S32). Subsequently, according to the determination, the count unit 14 increments the value of flg_false for the facility. The values of flg_true and flg_false for each facility are set to 0 before the determination (S02) and count (S03) processing.
  • the number information acquisition unit 15 acquires the number information (S04). Subsequently, a score indicating the popularity of the facility is calculated by the popularity estimation unit 16 based on the value counted by the counting unit 14 and the number of people information acquired by the number of people information acquisition unit 15 (S05). Subsequently, the output unit 17 outputs information indicating the estimated popularity (S06).
  • the above is the processing executed by the server 10 according to the present embodiment.
  • the posting data relates to the estimation target facility and whether the user who posted the posting data has visited the estimation target facility.
  • Post data corresponding to the determination is counted, and the popularity of the estimation target facility is estimated based on the counted value and the number of people information. Therefore, the posted data is appropriately considered in estimating the popularity. Therefore, according to the place popularity estimation system according to an embodiment of the present invention, it is possible to appropriately estimate the popularity of a place such as a facility in consideration of a user visit.
  • the counted value is the one shown in the facility and microblog association management table of FIG.
  • the number of posted data related to the estimation target facility that is, the sum of the values of flg_false and flg_true is 200 + 10, and the facility name “B” is the largest. Therefore, if it is not determined whether the user has visited the facility, the facility name “B” is estimated to be the most popular.
  • the facility name “A” is the most, and the facility that is considered to be visited by the most users is the facility having the facility name “A”.
  • the facility name “B” there is relatively little post data indicating that the user has visited the facility. Therefore, when considering the visit of the user, it is considered appropriate that the facility name “A” is estimated to be the most popular.
  • the facility name “A” is considered to be the most popular, and appropriate estimation is made.
  • the popularity of the facility whose facility name is “C” is higher than the popularity of the facility whose facility name is “D”.
  • the popularity of the facility “D” is higher than the popularity of the facility “C”.
  • post data that does not indicate that the user has visited the facility that is, flg_false is also counted and used to estimate the popularity.
  • Appropriate estimation can be performed in consideration.
  • the estimated popularity is used when providing information to the user as described above. Therefore, by estimating the appropriate popularity level, the information provided to the user can be limited to only the appropriate information, reducing the amount of communication with the terminal, and the processing load when providing information Can be reduced. That is, according to the present embodiment, it is possible to efficiently use network resources or hardware resources when providing information.
  • the posting data includes the determination whether the posting data is related to the estimation target facility and the determination that the user has visited the estimation target facility.
  • Text and position information may be used. According to this configuration, the determination can be performed appropriately and reliably, and one embodiment of the present invention can be implemented appropriately and reliably.
  • the above-described determination is not necessarily performed by the above-described method using the above-described information, and may be performed in any manner as long as it uses post data.
  • the number of meshes indicated by the number information may be weighted according to the values of flg_false and flg_true to calculate the score. According to this configuration, the popularity of the facility can be estimated appropriately and reliably.
  • the popularity score is calculated using the value of the ratio of flg_false and flg_true to the sum of the values of flg_false and flg_true for all facilities included in the mesh. It is good. Normally, the number of post data with a visit flag is smaller than that of post data without a visit flag. By using the ratio value as described above, it is possible to appropriately and easily increase the weight of post data with a visit flag. Therefore, according to this configuration, the popularity of the facility can be estimated more appropriately. However, it is not always necessary to use the above ratio value and the above-described formula for calculating the score, and any estimation may be performed as long as the popularity is estimated based on the counted value.
  • the facility name is used as the description according to the facility in the text.
  • the character string is according to the facility, other character strings are used. Also good.
  • each functional block may be realized by one device physically and / or logically coupled, and two or more devices physically and / or logically separated may be directly and / or indirectly. (For example, wired and / or wireless) and may be realized by these plural devices.
  • the server 10 may function as a computer that performs processing of the server 10 according to the present embodiment.
  • FIG. 10 is a diagram illustrating an example of a hardware configuration of the server 10 according to the present embodiment.
  • the server 10 described above may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the term “apparatus” can be read as a circuit, a device, a unit, or the like.
  • the hardware configuration of the server 10 may be configured to include one or a plurality of devices illustrated in the figure, or may be configured not to include some devices.
  • Each function in the server 10 is performed by reading predetermined software (program) on hardware such as the processor 1001 and the memory 1002, so that the processor 1001 performs an operation and performs communication by the communication device 1004, and in the memory 1002 and the storage 1003. This is realized by controlling reading and / or writing of data.
  • the processor 1001 controls the entire computer by operating an operating system, for example.
  • the processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic device, a register, and the like.
  • CPU central processing unit
  • the functional units 11 to 17 of the server 10 may be realized including the processor 1001.
  • the processor 1001 reads a program (program code), a software module, and data from the storage 1003 and / or the communication device 1004 to the memory 1002, and executes various processes according to these.
  • a program program code
  • a software module software module
  • data data from the storage 1003 and / or the communication device 1004 to the memory 1002, and executes various processes according to these.
  • the program a program that causes a computer to execute at least a part of the operations described in the above embodiments is used.
  • each of the functional units 11 to 17 of the server 10 may be realized by a control program stored in the memory 1002 and operated by the processor 1001, and may be realized similarly for other functional blocks.
  • the above-described various processes have been described as being executed by one processor 1001, they may be executed simultaneously or sequentially by two or more processors 1001.
  • the processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via a telecommunication line.
  • the memory 1002 is a computer-readable recording medium, and includes, for example, at least one of ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), RAM (Random Access Memory), and the like. May be.
  • the memory 1002 may be called a register, a cache, a main memory (main storage device), or the like.
  • the memory 1002 can store a program (program code), a software module, and the like that can be executed to perform the method according to the embodiment of the present invention.
  • the storage 1003 is a computer-readable recording medium such as an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, a magneto-optical disk (for example, a compact disk, a digital versatile disk, a Blu-ray). (Registered trademark) disk, smart card, flash memory (for example, card, stick, key drive), floppy (registered trademark) disk, magnetic strip, and the like.
  • the storage 1003 may be referred to as an auxiliary storage device.
  • the storage medium described above may be, for example, a database, server, or other suitable medium including the memory 1002 and / or the storage 1003.
  • the communication device 1004 is hardware (transmission / reception device) for performing communication between computers via a wired and / or wireless network, and is also referred to as a network device, a network controller, a network card, a communication module, or the like.
  • a network device for performing communication between computers via a wired and / or wireless network
  • a network controller for controlling network access
  • a network card for controlling communication between computers via a wired and / or wireless network
  • a communication module or the like.
  • the functional units 11 to 17 of the server 10 described above may be realized including the communication device 1004.
  • the input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, etc.) that accepts an input from the outside.
  • the output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that performs output to the outside.
  • the input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).
  • each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured with a single bus or may be configured with different buses between apparatuses.
  • the server 10 includes hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), and a field programmable gate array (FPGA). Some or all of the functional blocks may be realized by the hardware. For example, the processor 1001 may be implemented by at least one of these hardware.
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • the input / output information or the like may be stored in a specific location (for example, a memory) or may be managed by a management table. Input / output information and the like can be overwritten, updated, or additionally written. The output information or the like may be deleted. The input information or the like may be transmitted to another device.
  • the determination may be performed by a value represented by 1 bit (0 or 1), may be performed by a true / false value (Boolean: true or false), or may be performed by comparing numerical values (for example, a predetermined value) Comparison with the value).
  • notification of predetermined information is not limited to explicitly performed, but is performed implicitly (for example, notification of the predetermined information is not performed). Also good.
  • software, instructions, etc. may be transmitted / received via a transmission medium.
  • software may use websites, servers, or other devices using wired technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or wireless technology such as infrared, wireless and microwave.
  • wired technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or wireless technology such as infrared, wireless and microwave.
  • DSL digital subscriber line
  • wireless technology such as infrared, wireless and microwave.
  • system and “network” used in this specification are used interchangeably.
  • information, parameters, and the like described in this specification may be represented by absolute values, may be represented by relative values from a predetermined value, or may be represented by other corresponding information. .
  • a mobile communication terminal is defined by those skilled in the art as a subscriber station, mobile unit, subscriber unit, wireless unit, remote unit, mobile device, wireless device, wireless communication device, remote device, mobile subscriber station, access terminal, mobile terminal, It may also be referred to as a wireless terminal, remote terminal, handset, user agent, mobile client, client, or some other appropriate terminology.
  • determining may encompass a wide variety of actions.
  • “Judgment”, “decision” can be, for example, calculating, computing, processing, deriving, investigating, looking up (eg, table, database or another (Searching in the data structure), and confirming (ascertaining) what has been confirmed may be considered as “determining” or “deciding”.
  • “determination” and “determination” include receiving (for example, receiving information), transmitting (for example, transmitting information), input (input), output (output), and access. (accessing) (e.g., accessing data in a memory) may be considered as "determined” or "determined”.
  • determination and “decision” means that “resolving”, “selecting”, “choosing”, “establishing”, and “comparing” are regarded as “determining” and “deciding”. May be included. In other words, “determination” and “determination” may include considering some operation as “determination” and “determination”.
  • the phrase “based on” does not mean “based only on”, unless expressly specified otherwise. In other words, the phrase “based on” means both “based only on” and “based at least on.”

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

ユーザの訪問を考慮して、施設等の場所の人気度を適切に推定する。 サーバ10は、施設の人気度を推定する場所人気度推定システムである。サーバ10は、ユーザから投稿された投稿データを取得する投稿データ取得部12と、投稿データが、推定対象の施設に係るものであると共に当該投稿データを投稿したユーザが当該推定対象の施設を訪問したことを示すものであるかを判定する投稿データ判定部13と、判定に応じて、推定対象の施設について投稿データをカウントするカウント部14と、推定対象の施設を含むメッシュに位置している人数を示す人数情報を取得する人数情報取得部15と、カウントされた値及び人数情報によって示される人数に基づいて、推定対象の施設の人気度を推定する人気度推定部16と、推定された人気度を示す情報を出力する出力部17とを備える。

Description

場所人気度推定システム
 本発明は、場所の人気度を推定する場所人気度推定システムに関する。
 特許文献1に記載されているように、従来から、レストラン等の施設の人気度をはかってランク付けすることが提案されている。特許文献1においては、ランクは、対象地域が区切られたブロックの人数に基づいて設定されるとされている。また、インターネットのホームページ又は掲示板に、レストランの名前が記述されている場合、レストランが存在する位置のランクを更新するとされている。
特開2007-156637号公報
 移動通信端末が在圏している基地局又はGPS(グローバル・ポジショニング・システム)等から抽出できるユーザの位置を示す位置情報のデータと、マイクロブログ等のユーザによって投稿されたデータとを用いて施設の人気度を推定することを考える。推定したい人気度は、ユーザが訪れる施設としてどのくらい人気があるか、即ち、どの程度の数のユーザが施設を訪れているかを示すものである。
 上記の位置情報のデータは、通常、誤差が含まれるため、ある程度の範囲の情報、例えば、メッシュ単位の人数の情報しか抽出することができない。従って、位置情報のデータから、ユーザがどの施設に実際に訪れたかを把握することは困難である。そこで、特許文献1に示されているように、ユーザによって投稿されたデータを用いて、メッシュ単位の人数を補正して、施設の人気度を推定することが考えられる。例えば、投稿されたデータであるテキストのうち、当該施設の名称が記載されているテキストを施設毎にカウントし、当該テキストの数が多い施設ほど人気のある施設であると推定することが考えらえる。
 しかしながら、上記の方法では、訪問されていない施設の名称がテキストに記載されていた場合であっても、当該施設の人気度が高くなってしまう。例えば、事故又は事件のニュース等に施設が取り上げられると、当該施設の名称が記載されたテキストの数が膨大になることがある。このような場合、適切に施設の人気度を推定することができない。
 本発明は、上記に鑑みてなされたものであり、ユーザの訪問を考慮して、施設等の場所の人気度を適切に推定することができる場所人気度推定システムを提供することを目的とする。
 上記の目的を達成するために、本発明の一実施形態に係る場所人気度推定システムは、場所の人気度を推定する場所人気度推定システムであって、ユーザから投稿された投稿データを取得する投稿データ取得部と、投稿データ取得部によって取得された投稿データが、推定対象の場所に係るものであると共に当該投稿データを投稿したユーザが当該推定対象の場所を訪問したことを示すものであるかを判定する投稿データ判定部と、投稿データ判定部による判定に応じて、推定対象の場所について投稿データをカウントするカウント部と、推定対象の場所を含む領域に位置している人数を示す人数情報を取得する人数情報取得部と、カウント部によってカウントされた値、及び人数情報取得部によって取得された人数情報によって示される人数に基づいて、推定対象の場所の人気度を推定する人気度推定部と、人気度推定部によって推定された人気度を示す情報を出力する出力部と、を備える。
 本発明の一実施形態に係る場所人気度推定システムでは、投稿データについて、推定対象の場所に係るものであるか、及び当該投稿データを投稿したユーザが当該推定対象の場所を訪問したことを示すものであるかの判定が行われる。当該判定に応じた投稿データがカウントされ、カウントされた値、及び人数情報に基づいて、推定対象の場所の人気度が推定される。従って、投稿データが、人気度の推定の上で適切に考慮される。即ち、本発明の一実施形態に係る場所人気度推定システムによれば、ユーザの訪問を考慮して、施設等の場所の人気度を適切に推定することができる。
 本発明の一実施形態によれば、投稿データが、人気度の推定の上で適切に考慮されるため、ユーザの訪問を考慮して、施設等の場所の人気度を適切に推定することができる。
本発明の実施形態に係る場所人気度推定システムであるサーバの構成を示す図である。 マイクロブログ管理テーブルを示す図である。 施設情報管理テーブルを示す図である。 訪問ルール形態素管理テーブルを示す図である。 施設とマイクロブログ紐付け管理テーブルを示す図である。 メッシュ統計人口管理テーブルを示す図である。 施設スコア管理テーブルを示す図である。 本発明の実施形態に係る場所人気度推定システムであるサーバで実行される処理全体を示すフローチャートである。 本発明の実施形態に係る場所人気度推定システムであるサーバで実行される処理のうち、判定及びカウントの処理を示すフローチャートである。 本発明の実施形態に係る場所人気度推定システムであるサーバのハードウェア構成を示す図である。
 以下、図面と共に本発明に係る場所人気度推定システムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
 図1に本実施形態に係る場所人気度推定システムであるサーバ10を示す。サーバ10は、場所の人気度を推定するシステム(装置)である。本実施形態において、人気度の推定対象となる場所は、店舗、レジャー施設及び観光施設といった施設である。なお、人気度の推定対象となる場所は、位置を特定することができる任意の場所であればよく、施設以外の場所、例えば、施設以外の観光地及びPOI(Point of Interest)等であってもよい。人気度は、ユーザが訪れる施設としてどのくらい人気があるか、即ち、どの程度の数のユーザが施設を訪れているかを示すものである。推定される人気度は、例えば、施設の情報をユーザに提供する際に利用され得る。具体的には、施設の人気度のランクに基づいて、ユーザによって施設の情報の検索が行われる場合に人気度の高い施設を上位に表示したり、近隣のユーザに人気度の高い施設をレコメンドしたりすることができる。
 サーバ10は、インターネット等のネットワークに接続されており、他の装置との間で通信を行うことができる。サーバ10は、他の装置との間で、施設の人気度の推定に用いる情報を送受信する。どのような装置と、どのような情報をやり取りするのかは後述する。
 引き続いて、本実施形態に係るサーバ10の機能を説明する。図1に示すようにサーバ10は、記憶部11と、投稿データ取得部12と、投稿データ判定部13と、カウント部14と、人数情報取得部15と、人気度推定部16と、出力部17とを備えて構成される。
 記憶部11は、サーバ10における処理に必要となる情報を記憶する機能部である。記憶部11が、どのような情報を記憶するかについては後述する。
 投稿データ取得部12は、ユーザから投稿された投稿データを取得する機能部である。投稿データ取得部12によって取得される投稿データは、例えば、不特定多数のユーザの移動通信端末であるユーザ端末からマイクロブログに投稿(発信)されたテキストを含むデータである。投稿データは、当該テキストが投稿された位置を示す位置情報、即ち、ジオタグを含み得る。位置情報は、例えば、当該テキストが投稿された際のユーザ端末の位置を示す情報である。位置情報は、例えば、ユーザ端末においてGPS機能によって取得されるユーザ端末の位置の緯度及び経度を示す情報である。なお、マイクロブログのサービスは、マイクロブログサーバによって提供される。
 記憶部11は、投稿データを記憶する。記憶部11は、投稿データをマイクロブログ管理テーブルで保持する。図2にマイクロブログ管理テーブルを示す。1つの行(レコード)が、1つの投稿データについての情報である。図2に示すようにマイクロブログ管理テーブルは、text_id、user_id、time_stamp、lat、lng及びtextの欄に、それぞれ対応付けられた情報を格納する。text_idの欄に格納される情報は、投稿されたテキスト(投稿データ)を識別する識別子である。user_idの欄に格納される情報は、テキストを投稿したユーザを識別する識別子である。当該識別子は、例えば、マイクロブログにおいてユーザの識別に用いられる識別子である。time_stampの欄に格納される情報は、テキストが投稿された時刻、具体的には、テキストが投稿された年月日、時間、分及び秒を示す情報である。
 lat及びlngの欄に格納される情報は、テキストが投稿された位置を示す位置情報であり、具体的には、それぞれ緯度及び経度を示す情報である。投稿が行われる際の設定等によって、位置情報は投稿データに含まれない場合がある。例えば、図2に示すマイクロブログ管理テーブルの2行目及び4行目の投稿データには、位置情報が含まれない。textの欄に格納される情報は、投稿されたテキスト(文字列)である。本実施形態では、投稿されたテキストは日本語である場合の例を示すが、日本語以外であっても本実施形態と同様に本発明の位置実施形態を実施することができる。
 マイクロブログ管理テーブルに格納される投稿データは、予め、サーバ10によってマイクロブログサーバから取得されている。あるいは、当該情報は、予め、サーバ10の管理者等によって、マイクロブログサーバから取得されてサーバ10に入力されていてもよい。
 投稿データ取得部12は、マイクロブログ管理テーブルに格納される複数の投稿データを読み出して取得する。投稿データ取得部12は、テキストが投稿された時刻が、予め設定した時間帯、例えば後述する人数情報に対応する時間帯である投稿データのみを取得することとしてもよい。また、投稿データ取得部12は、マイクロブログサーバに投稿データを要求して、マイクロブログサーバから投稿データを受信して取得してもよい。投稿データ取得部12は、取得した投稿データを投稿データ判定部13に出力する。
 投稿データ判定部13は、投稿データ取得部12によって取得された投稿データが、推定対象の施設に係るものであると共に当該投稿データを投稿したユーザが当該推定対象の施設を訪問したことを示すものであるかを判定する機能部である。投稿データが推定対象の施設に係るものであるとは、例えば、投稿データのテキストが当該施設について記載されたものであることである。投稿データ判定部13は、投稿データに含まれるテキストに推定対象の施設に応じた記載が含まれているか否かを判定して、投稿データが推定対象の施設に係るものであるか否かを判定することとしてもよい。
 投稿データ判定部13は、投稿データに含まれるテキストに基づいて、当該投稿データを投稿したユーザが推定対象の施設を訪問したことを示すものであるかを判定することとしてもよい。あるいは、投稿データ判定部13は、投稿データに含まれる位置情報に基づいて、当該投稿データを投稿したユーザが推定対象の施設を訪問したことを示すものであるかを判定することとしてもよい。
 記憶部11は、当該判定に用いられる情報を記憶する。記憶部11は、当該情報を施設情報管理テーブル及び訪問ルール形態素管理テーブルで保持する。図3に施設情報管理テーブルを示す。施設情報管理テーブルは、推定対象の施設についての情報を保持するテーブルである。1つの行(レコード)が、1つの施設についての情報である。
 図3に示すように施設情報管理テーブルは、施設名称、mesh_code、lat及びlngの欄に、それぞれ対応付けられた情報を格納する。施設名称の欄に格納される情報は、施設の施設名称である文字列である。mesh_codeの欄に格納される情報は、当該施設の位置を含むメッシュを識別する識別子である。メッシュは、施設が設けられる地域を分割したものである。各メッシュは、例えば、一辺が数十m~数百m程度の矩形である。例えば、図3に示す施設情報管理テーブルの4つの施設に係る情報は、全て同じメッシュ内に位置している。lat及びlngの欄に格納される情報は、施設の位置を示す位置情報であり、具体的には、それぞれ緯度及び経度を示す情報である。
 図4に訪問ルール形態素管理テーブルを示す。訪問ルール形態素管理テーブルは、投稿データを投稿したユーザが推定対象の施設を訪問したことを示すものであるかの判定に用いる情報を保持するテーブルである。図4に示すように訪問ルール形態素管理テーブルは、id及び訪問ルール形態素の欄に、それぞれ対応付けられた情報を格納する。idの欄に格納される情報は、訪問ルール形態素管理テーブルに格納される各情報を識別する識別子である。訪問ルール形態素の欄に格納される情報は、上記の判定に用いられる形態素である文字列である。当該文字列は、ユーザの施設への訪問を示しているもの、例えば、図4に示すように「行く」「来る」「訪れる」「いる」等のものである。施設情報管理テーブル及び訪問ルール形態素管理テーブルに保持される情報は、予め、サーバ10の管理者等によって、サーバ10に入力されている。
 投稿データ判定部13は、以下のように判定を行う。投稿データ判定部13は、投稿データ取得部12から投稿データを入力する。また、投稿データ判定部13は、施設情報管理テーブル及び訪問ルール形態素管理テーブルに保持される情報を読み出す。投稿データ判定部13は、入力した投稿データ毎に判定を行う。投稿データ判定部13は、投稿データに含まれるテキストについて形態素解析を行う。形態素解析は、従来の任意の方法を利用して行われる。形態素解析においては、各形態素の時制が現在にされてもよい。
 投稿データ判定部13は、形態素解析によって得られた各形態素について、施設名称と一致するものがあるか判断する。この一致の判断は、全ての施設の施設名称に対して行われる。投稿データ判定部13は、何れかの形態素と施設名称が一致したと判断した場合、投稿データが当該施設名称の施設に係るものであると判定する。即ち、テキストの中に施設名称が含まれていれば、投稿データが当該施設名称の施設に係るものであると判定される。投稿データ判定部13は、何れの形態素も施設名称と一致しないと判断した場合、投稿データが何れか施設に係るものでないと判定する。
 投稿データ判定部13は、投稿データが何れかの施設に係るものであると判定した場合、引き続いて、当該投稿データに位置情報が含まれているか(付与されているか)を判断する。投稿データ判定部13は、投稿データに位置情報が含まれていると判断した場合、当該位置情報によって示される位置が、投稿データに係るとされた施設のメッシュ内であるか否かを判断する。投稿データ判定部13は、予め緯度及び経度とメッシュとの対応関係を記憶しており、当該対応関係に基づいて上記の判断を行う。
 投稿データ判定部13は、投稿データに含まれる位置情報によって示される位置が、施設のメッシュ内であると判断した場合、当該投稿データが、当該投稿データを投稿したユーザが当該施設を訪問したことを示すものであると判定する。即ち、投稿データ判定部13は、この場合、当該投稿データについて訪問フラグ有と判定(分類)する。当該判定は、施設に係る投稿を行っており、投稿された位置が施設のメッシュ内であった場合、ユーザが当該施設を訪問している蓋然性があることに基づいている。投稿データ判定部13は、投稿データに含まれる位置情報によって示される位置が、施設のメッシュ内ではないと判断した場合、当該投稿データが、当該投稿データを投稿したユーザが当該施設を訪問したことを示すものであると判定しない。即ち、投稿データ判定部13は、この場合、当該投稿データについて訪問フラグ無と判定(分類)する。
 なお、上記の判定は、投稿データに係る位置が施設のメッシュ内であるか否かを判定するものであったが、例えば以下のように、投稿データに係る位置と施設の位置との距離に基づく判断を行うこととしてもよい。投稿データ判定部13は、投稿データに係る位置を示す緯度及び経度と、施設情報管理テーブルに含まれている施設の位置を示す緯度及び経度との距離を算出する。投稿データ判定部13は、算出した距離と予め設定した閾値(例えば、数m~数十m)とを比較する。投稿データ判定部13は、比較によって、距離が閾値以下であると判断した場合、当該投稿データについて訪問フラグ有と判定(分類)する。投稿データ判定部13は、比較によって、距離が閾値以下でないと判断した場合、当該投稿データについて訪問フラグ無と判定(分類)する。
 投稿データ判定部13は、投稿データに位置情報が含まれていないと判断した場合、形態素解析によって得られた各形態素について、訪問ルール形態素と一致するものがあるか判断する。この一致の判断は、全ての訪問ルール形態素に対して行われる。投稿データ判定部13は、何れかの形態素と訪問ルール形態素が一致したと判断した場合、当該投稿データが、当該投稿データを投稿したユーザが当該施設を訪問したことを示すものであると判定する。即ち、投稿データ判定部13は、この場合、当該投稿データについて訪問フラグ有と判定(分類)する。当該判定は、施設に係る投稿を行っており、投稿されたテキストに施設への訪問を示す文字列が含まれていた場合、ユーザが当該施設を訪問している蓋然性があることに基づいている。投稿データ判定部13は、何れの形態素も訪問ルール形態素と一致しないと判断した場合、当該投稿データが、当該投稿データを投稿したユーザが当該施設を訪問したことを示すものであると判定しない。即ち、投稿データ判定部13は、この場合、当該投稿データについて訪問フラグ無と判定(分類)する。
 図2に示す投稿データについての上記の判定の例を示す。text_idが「textID_0001」(図2のマイクロブログ管理テーブルの1行目の投稿データ)の投稿データについてのテキストは、形態素解析により「A/の/サービス/素晴らしい」となる(「/」が形態素の区切りを示す)。これらの形態素の中に、施設名称である形態素「A」が存在する。当該投稿データには位置情報が含まれるため、当該位置情報(139.01,35.01)によって示される位置が施設名称「A」の施設のメッシュ「mesh_A」内か否かが判断される。当該位置がメッシュ内であるので、当該投稿データが、施設名称「A」の施設に係るものであると共に訪問フラグ有と判定される。
 text_idが「textID_0002」(図2のマイクロブログ管理テーブルの2行目の投稿データ)の投稿データについてのテキストは、形態素解析により「東京/観光/で/A/に/初めて/来る/!/展望台/から/の/眺め/が/すごい/!」となる。これらの形態素の中に、施設名称である形態素「A」が存在する。当該投稿データには位置情報が含まれないため、形態素の中に、訪問ルール形態素と一致する形態素が存在するか否かが判断される。これらの形態素の中に、訪問ルール形態素である形態素「来る」が存在する。従って、当該投稿データが、施設名称「A」の施設に係るものであると共に訪問フラグ有と判定される。
 text_idが「textID_0003」(図2のマイクロブログ管理テーブルの3行目の投稿データ)の投稿データについてのテキストは、形態素解析により「A/の/CM/見る/けど/行く/みたい/わー」となる。これらの形態素の中に、施設名称である形態素「A」が存在する。当該投稿データには位置情報が含まれるため、当該位置情報(138.00,34.00)によって示される位置が施設名称「A」の施設のメッシュ「mesh_A」内か否かが判断される。当該位置がメッシュ内にないので、当該投稿データが、施設名称「A」の施設に係るものであると共に訪問フラグ無と判定される。
 text_idが「textID_0004」(図2のマイクロブログ管理テーブルの4行目の投稿データ)の投稿データは、上記の同様の判定によって、施設名称「B」の施設に係るものであると共に訪問フラグ有と判定される。
 投稿データ判定部13は、投稿データ毎に上記の判定結果を示す情報をカウント部14に出力する。例えば、投稿データ判定部13は、何れかの施設に係るものとされた投稿データについて、当該施設を示す情報、及び当該投稿データを投稿したユーザが当該推定対象の施設を訪問したことを示すものであると判定したか否かを示す情報をカウント部14に出力する。
 カウント部14は、投稿データ判定部13による判定に応じて、推定対象の施設について投稿データをカウントする機能部である。カウント部14は、投稿データ判定部13から判定結果を示す情報を入力する。カウント部14は、当該情報に基づき、施設毎に、当該施設に係ると判定された投稿データのうち、ユーザが当該施設を訪問したことを示すものであると判定された投稿データの数、及びユーザが当該施設を訪問したことを示すものであると判定されなかった投稿データの数をそれぞれカウントする。
 カウント部14によってカウントされる数は、例えば、図5に示す施設とマイクロブログ紐付け管理テーブルにまとめられる。図5に示すように施設とマイクロブログ紐付け管理テーブルは、施設名称、mesh_code、flg_false及びflg_trueの欄に、それぞれ対応付けられた情報を格納する。施設名称及びmesh_codeの欄に格納される情報はそれぞれ、カウントされる数に係る施設の施設名称である文字列、及び当該施設の位置を含むメッシュの識別子である。flg_falseの欄に格納される情報は、当該施設に係ると判定された投稿データのうち、訪問フラグ無と判定された投稿データの数である。flg_trueの欄に格納される情報は、当該施設に係ると判定された投稿データのうち、訪問フラグ有と判定された投稿データの数である。flg_trueの数は、ユーザが施設を訪問した上で、当該施設についての投稿を行った(と推定される)数である。カウント部14は、カウントによって得られた図5に示す施設とマイクロブログ紐付け管理テーブルの情報を人気度推定部16に出力する。
 なお、上記の数は、投稿データの数(投稿数)ではなく、ユーザ数としてもよい。即ち、同一のユーザが、同一の判定が行われる複数の投稿を行ったとしても、複数回カウントせず、1とカウントする。このカウントによって、1人のユーザが、何度も同一の判定が行われる投稿を行ったとしても、ユーザあたりの投稿の回数を考慮せずに施設の人気度の推定を行うことができる。
 人数情報取得部15は、推定対象の施設を含む領域に位置している人数を示す人数情報を取得する機能部である。例えば、当該領域は、上述したメッシュであり、当該人数情報は、メッシュ及び時間帯毎の人数を示す情報である。
 記憶部11は、人数情報を記憶する。記憶部11は、人数情報をメッシュ統計人口管理テーブルで保持する。図6にメッシュ統計人口管理テーブルを示す。1つの行(レコード)が、1つのメッシュ及び1つの時間帯についての人数情報である。図6に示すようにメッシュ統計人口管理テーブルは、mesh_code、date、time_start、time_end及びpopulationの欄に、それぞれ対応付けられた情報を格納する。mesh_codeの欄に格納される情報は、人数情報に係るメッシュの識別子である。date、time_start及びtime_endの欄に格納される情報は、人数情報に係る時間帯を示す情報である。dateの欄に格納される情報は年月日を示す情報である。time_start及びtime_endの欄に格納される情報は、それぞれ当該時間帯の開始時刻及び終了時刻の時間、分及び秒を示す情報である。populationの欄に格納される情報は、当該メッシュ及び当該時間帯における人数である。
 各メッシュの人数は、例えば、携帯電話機等の移動通信端末(ユーザ端末)の位置を示す情報に基づいて得ることができる。メッシュ毎の移動通信端末の数をカウントすることで、当該メッシュの人数情報が得られる。メッシュ統計人口管理テーブルに格納されるデータは、例えば、予め、サーバ10によって人数情報を提供する移動体通信の通信事業者のサーバ等から取得されている。あるいは、当該情報は、予め、サーバ10の管理者等によって、当該通信事業者のサーバ等から取得されてサーバ10に入力されていてもよい。
 人数情報取得部15は、メッシュ統計人口管理テーブルに格納される人数情報を読み出して取得する。人数情報取得部15は、予め設定した時間帯(例えば、現時点から過去1時間、1日分、1週間分、1ヶ月分等)の人数情報のみを取得することとしてもよい。また、人数情報取得部15は、通信事業者のサーバ等に人数情報を要求して、当該通信事業者のサーバ等から人数情報を受信して取得してもよい。人数情報取得部15は、取得した人数情報を人気度推定部16に出力する。
 人気度推定部16は、カウント部14によってカウントされた値、及び人数情報取得部15によって取得された人数情報によって示される人数に基づいて、推定対象の施設の人気度を推定する機能部である。人気度推定部16は、人数情報取得部15によって取得された人数情報によって示される人数に対して、カウント部14によってカウントされた値に応じた重み付けを行って、推定対象の施設の人気度を示すスコアを算出してもよい。人気度推定部16は、カウント部14によってカウントされた値の、推定対象の施設を含む領域であるメッシュ内の施設毎の割合に基づいて、推定対象の施設の人気度を推定してもよい。
 人気度推定部16は、カウント部14及び人数情報取得部15から、それぞれ情報を入力する。人気度推定部16は、入力した情報に基づいて、人気度推定部16は、施設毎の人気度を示すスコアを算出して、人気度を推定する。人気度推定部16は、以下の式によって、施設POIの人気度を示すスコアPOP(POI)を算出する。
Figure JPOXMLDOC01-appb-M000001
上記の式において、Pは、推定対象の施設が含まれるメッシュの人数である。人気度推定部16は、人数情報によって示される人数からPを算出する。例えば、人気度推定部16は、1日分の人数情報を用いて、当該メッシュの1時間単位の人数情報の平均値をPとする。flg_false(POI)及びflg_true(POI)は、それぞれ当該施設のflg_false及びflg_trueの値である。sum(flg_false)は、当該メッシュに含まれる施設全てのflg_falseの値の総和である。sum(flg_true)は、当該メッシュに含まれる施設全てのflg_trueの値の総和である。α,βは、予め設定されたそれぞれの項の重み係数である。例えば、α=β=1とする。なお、訪問フラグ有とされた投稿データの重みを、訪問フラグ無とされた投稿データの重みよりも重くしたい場合には、βの値をαの値と比べて大きくすればよい。また、α,βは、チューニングによって適宜、調節されてもよい。
 上記の式に示す通り、スコアPOP(POI)は、当該メッシュの人数を、flg_false(POI)及びflg_true(POI)それぞれの値で重み付けしたものである。スコアPOP(POI)は、施設に訪れた人数の指標値である。スコアPOP(POI)が大きいほど、多くの人が訪れていると考えられ、高い人気を有している施設であることを示している。
 例えば、メッシュの中にある施設が、図5の施設とマイクロブログ紐付け管理テーブルに示す4つの施設であり、各施設についてのflg_false及びflg_trueの値が当該テーブルに示すものであったとする。また、メッシュの人数の平均値Pが200であったとする。この場合、各施設についてのスコアPOP(POI)は、以下のようになる。
 POP(A)=200/2*{(1*100/380)+(1*50/85)}=100*(0.263+0.588)=85.1
 POP(B)=200/2*{(1*200/380)+(1*10/85)}=100*(0.526+0.118)=64.4
 POP(C)=200/2*{(1* 50/380)+(1*10/85)}=100*(0.132+0.118)=25.0
 POP(D)=200/2*{(1* 30/380)+(1*15/85)}=100*(0.079+0.176)=25.5
 なお、上記の例では、1日分の人数情報を用いることとしたが、特定の時間帯の人数情報のみを用いることとしてもよい。例えば、施設(店舗)が営業していない深夜の時間帯の人数情報を用いないこととしてもよい。また、複数日(例えば、1ヶ月)の人数情報から、1日の中の時間帯毎の人数の平均値を段出して、時間帯毎の施設のスコアを算出してもよい。即ち、時間帯毎の施設の人気度を推定してもよい。
 また、各施設についてのflg_false及びflg_trueの値についても、人数の平均の算出に用いられる人数情報の時間帯に対応する投稿データのみを用いて算出することとしてもよい。
 人気度推定部16は、算出したスコアを、例えば、図7に示す施設スコア管理テーブルにまとめる。図7に示すように施設スコア管理テーブルは、施設名称、mesh_code、scoreの欄に、それぞれ対応付けられた情報を格納する。施設名称及びmesh_codeの欄に格納される情報はそれぞれ、算出されるスコアに係る施設の施設名称である文字列、及び当該施設の位置を含むメッシュの識別子である。scoreの欄に格納される情報は、算出されるスコアである。人気度推定部16は、施設スコア管理テーブルの情報を出力部17に出力する。
 出力部17は、人気度推定部16によって推定された人気度を示す情報を出力する機能部である。出力部17は、人気度推定部16から図7に示す施設スコア管理テーブルの情報を入力する。例えば、出力部17は、図7に示す施設スコア管理テーブルの情報を記憶部11に出力して記憶させる。記憶部11に記憶された施設スコア管理テーブルの情報は、施設の情報をユーザに提供する装置又はモジュール等によって参照される。あるいは、出力部17は、当該情報を当該装置又はモジュールに送信してもよい。
 なお、上記の各機能部の動作は、例えば、サーバ10の管理者等によってトリガがサーバ10に入力されたタイミング、又は予め設定されたタイミングで行われる。具体的には、ユーザに施設の情報の提供が行われる前、又は行われる際に行われる。以上が、本実施形態に係るサーバ10の機能である。
 引き続いて、図8及び図9のフローチャートを用いて、本実施形態に係るサーバ10で実行される処理(サーバ10が行う動作方法)を説明する。図8のフローチャートを用いて、本処理全体の処理を説明する。
 本処理では、まず、投稿データ取得部12によって、投稿データが取得される(S01)。続いて、投稿データ判定部13によって、各投稿データについて、推定対象の施設に係るものであるかの判定、及び訪問フラグ有無の判定が行われる(S03)。続いて、カウント部14によって、投稿データ判定部13による判定に応じたカウントが行われる(S03)。
 上記の判定(S02)及びカウント(S03)の処理について、図9のフローチャートを用いて詳細に説明する。当該処理は、投稿データ毎に全ての投稿データについて行われる。本処理では、まず、投稿データ取得部12によって、投稿データに含まれるテキストについて形態素解析が行われる(S21)。続いて、投稿データ判定部13によって、各形態素について、施設名称と一致するものがあるか判断される(S22)。投稿データ判定部13によって、何れの形態素も施設名称と一致しないと判断された場合(S22のNO)、投稿データは何れか施設に係るものでないと判定される。この場合、投稿データはカウント対象とはされずに、当該投稿データについての処理が終了する。
 投稿データ判定部13によって、何れかの形態素と施設名称が一致したと判断された場合(S22のYES)、投稿データが当該施設名称の施設に係るものであると判定される。続いて、投稿データ判定部13によって、当該投稿データに位置情報が含まれているか(付与されているか)が判断される(S23)。投稿データ判定部13によって、投稿データに位置情報が含まれていると判断された場合(S23のYES)、続いて、当該位置情報によって示される位置が、投稿データに係るとされた施設のメッシュ内であるか否かが判断される(S24)。
 投稿データ判定部13によって、投稿データに含まれる位置情報によって示される位置が、施設のメッシュ内であると判断された場合(S24のYES)、当該投稿データについて訪問フラグ有と判定(分類)される。続いて、当該判定に応じて、カウント部14によって、当該施設についてのflg_trueの値が+1される(S31)。一方、S24において、投稿データ判定部13によって、投稿データに含まれる位置情報によって示される位置が、施設のメッシュ内ではないと判断された場合(S24のNO)、当該投稿データについて訪問フラグ無と判定(分類)される(S32)。続いて、当該判定に応じて、カウント部14によって、当該施設についてのflg_falseの値が+1される。各施設についてのflg_true及びflg_falseの値は、判定(S02)及びカウント(S03)の処理の前に0にされる。
 S23において、投稿データ判定部13によって、投稿データに位置情報が含まれていないと判断された場合(S23のNO)、続いて、各形態素について、訪問ルール形態素と一致するものがあるか判断される(S25)。投稿データ判定部13によって、何れかの形態素と訪問ルール形態素が一致したと判断された場合(S25のYES)、当該投稿データについて訪問フラグ有と判定(分類)される。続いて、当該判定に応じて、カウント部14によって、当該施設についてのflg_trueの値が+1される(S31)。一方、S25において、投稿データ判定部13によって、何れの形態素も訪問ルール形態素と一致しないと判断された場合(S25のNO)、当該投稿データについて訪問フラグ無と判定(分類)される。続いて、当該判定に応じて、カウント部14によって、当該施設についてのflg_falseの値が+1される(S32)。以上が、判定(S02)及びカウント(S03)の処理である。
 図8に戻り、続いて、人数情報取得部15によって、人数情報が取得される(S04)。続いて、カウント部14によってカウントされた値、及び人数情報取得部15によって取得された人数情報に基づいて、人気度推定部16によって、施設の人気度を示すスコアが算出される(S05)。続いて、出力部17によって、推定された人気度を示す情報が出力される(S06)。以上が、本実施形態に係るサーバ10で実行される処理である。
 本実施形態では、投稿データについて、推定対象の施設に係るものであるか、及び当該投稿データを投稿したユーザが当該推定対象の施設を訪問したことを示すものであるかの判定が行われる。当該判定に応じた投稿データがカウントされ、カウントされた値、及び人数情報に基づいて、推定対象の施設の人気度が推定される。従って、投稿データが、人気度の推定の上で適切に考慮される。従って、本発明の一実施形態に係る場所人気度推定システムによれば、ユーザの訪問を考慮して、施設等の場所の人気度を適切に推定することができる。
 例えば、カウントされた値が、図5の施設とマイクロブログ紐付け管理テーブルに示すものであった場合を考える。推定対象の施設に係る投稿データの数、即ち、flg_false及びflg_trueの値の和は、200+10で施設名称が「B」が最も多くなる。従って、ユーザが施設を訪問したことを示すものであるかの判定を行わない場合には、施設名称が「B」が最も人気があるという推定がなされてしまう。
 一方で、ユーザが施設を訪問したことを示す投稿データは、施設名称が「A」が最も多く、最も多くのユーザが訪れたと考えられる施設は、施設名称が「A」の施設である。施設名称が「B」については、ユーザが施設を訪問したことを示す投稿データは、比較的少ない。従って、ユーザの訪問を考慮した場合には、施設名称が「A」が最も人気があるという推定がなされることが適切であると考えられる。本実施形態では、図7の施設スコア管理テーブルに示すように施設名称が「A」が最も人気があるとされており、適切な推定がなされている。
 また、推定対象の施設に係る投稿データの数を用いれば、施設名称が「C」の施設の人気度が、施設名称が「D」の施設の人気度よりも高くなる。しかしながら、上記の「A」「B」の場合と同様に本実施形態では、「D」の施設の人気度が、「C」の施設の人気度よりも高くなる。
 また、ユーザが施設を訪問したことを示すものではない投稿データ、即ち、flg_falseもカウントされて、人気度の推定に用いられるため、ユーザが訪れたことのみによる推定ではなく、施設の評判等を考慮した適切な推定を行うことができる。推定された人気度は、上述したようにユーザへの情報の提供の際に用いられる。従って、適切な人気度の推定が行われることで、ユーザへ提供される情報を適切な情報のみとすることができ、端末との間の通信量を削減したり、情報提供の際の処理負荷を軽減したりすることができる。即ち、本実施形態によれば、情報の提供の際のネットワーク資源又はハードウェア資源を効率的に利用することができる。
 また、本実施形態のように、投稿データが推定対象の施設に係るものであるかの判定、及びユーザが推定対象の施設を訪問したことを示すものであるかの判定に、投稿データに含まれるテキスト及び位置情報を用いることとしてもよい。この構成によれば、適切かつ確実に判定を行うことができ、適切かつ確実に本発明の一実施形態を実施することができる。但し、上記の判定は、必ずしも上述した情報を用いて、上述した方法で行われる必要はなく、投稿データを用いたものであれば、どのように行われてもよい。
 また、本実施形態のように、人数情報によって示されるメッシュの人数に対して、flg_false及びflg_trueの値に応じた重み付けを行って、スコアを算出することとしてもよい。この構成によれば、施設の人気度を適切かつ確実に推定することができる。
 更に、本実施形態のスコアの算出の式のように、メッシュに含まれる施設全てのflg_false及びflg_trueの値の総和に対する、flg_false及びflg_trueの割合の値を用いて、人気度のスコアを算出することとしてもよい。通常、訪問フラグ有の投稿データは、訪問フラグ無の投稿データと比べて数が少ない。上記のように割合の値を用いることで、訪問フラグ有の投稿データの重みを適切かつ容易に重くすることができる。従って、この構成によれば、施設の人気度を更に適切に推定することができる。但し、必ずしも上記の割合の値及び上述した式をスコアの算出に用いる必要はなく、カウントした値に基づく人気度の推定であれば、どのように推定を行うこととしてもよい。
 なお、上述したように、本実施形態では、判定において、テキストにおける施設に応じた記載として、施設名称を用いたが、施設に応じた文字列であれば、それ以外の文字列が用いられてもよい。
 なお、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
 例えば、本発明の一実施の形態におけるサーバ10は、本実施形態のサーバ10の処理を行うコンピュータとして機能してもよい。図10は、本実施形態に係るサーバ10のハードウェア構成の一例を示す図である。上述のサーバ10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。サーバ10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 サーバ10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信、並びにメモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、サーバ10の各機能部11~17は、プロセッサ1001を含んで実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール及びデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、サーバ10の各機能部11~17は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。例えば、上述のサーバ10の各機能部11~17は、通信装置1004を含んで実現されてもよい。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001及びメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
 また、サーバ10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
 以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
 本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
 本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
 なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。
 本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
 また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。
 上述したパラメータに使用する名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。
 移動通信端末は、当業者によって、加入者局、モバイルユニット、加入者ユニット、ワイヤレスユニット、リモートユニット、モバイルデバイス、ワイヤレスデバイス、ワイヤレス通信デバイス、リモートデバイス、モバイル加入者局、アクセス端末、モバイル端末、ワイヤレス端末、リモート端末、ハンドセット、ユーザエージェント、モバイルクライアント、クライアント、またはいくつかの他の適切な用語で呼ばれる場合もある。
 本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
 本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
 本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
 10…サーバ、11…記憶部、12…投稿データ取得部、13…投稿データ判定部、14…カウント部、15…人数情報取得部、16…人気度推定部、17…出力部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。

Claims (6)

  1.  場所の人気度を推定する場所人気度推定システムであって、
     ユーザから投稿された投稿データを取得する投稿データ取得部と、
     前記投稿データ取得部によって取得された投稿データが、推定対象の場所に係るものであると共に当該投稿データを投稿したユーザが当該推定対象の場所を訪問したことを示すものであるかを判定する投稿データ判定部と、
     前記投稿データ判定部による判定に応じて、前記推定対象の場所について投稿データをカウントするカウント部と、
     前記推定対象の場所を含む領域に位置している人数を示す人数情報を取得する人数情報取得部と、
     前記カウント部によってカウントされた値、及び前記人数情報取得部によって取得された人数情報によって示される人数に基づいて、前記推定対象の場所の人気度を推定する人気度推定部と、
     前記人気度推定部によって推定された人気度を示す情報を出力する出力部と、
    を備える場所人気度推定システム。
  2.  前記人気度推定部は、前記人数情報取得部によって取得された人数情報によって示される人数に対して、前記カウント部によってカウントされた値に応じた重み付けを行って、前記推定対象の場所の人気度を示すスコアを算出する、請求項1に記載の場所人気度推定システム。
  3.  前記投稿データ取得部は、テキストを含む投稿データを取得し、
     前記投稿データ判定部は、前記投稿データに含まれるテキストに前記推定対象の場所に応じた記載が含まれているか否かを判定して、投稿データが推定対象の場所に係るものであるかを判定する、請求項1又は2に記載の場所人気度推定システム。
  4.  前記投稿データ取得部は、テキストを含む投稿データを取得し、
     前記投稿データ判定部は、前記投稿データに含まれるテキストに基づいて、当該投稿データを投稿したユーザが前記推定対象の場所を訪問したことを示すものであるかを判定する、請求項1~3の何れか一項に記載の場所人気度推定システム。
  5.  前記投稿データ取得部は、位置を示す位置情報を含む投稿データを取得し、
     前記投稿データ判定部は、前記投稿データに含まれる位置情報に基づいて、当該投稿データを投稿したユーザが前記推定対象の場所を訪問したことを示すものであるかを判定する、請求項1~4の何れか一項に記載の場所人気度推定システム。
  6.  前記人気度推定部は、前記カウント部によってカウントされた値の、前記推定対象の場所を含む領域内の場所毎の割合に基づいて、推定対象の場所の人気度を推定する請求項1~5の何れか一項に記載の場所人気度推定システム。
PCT/JP2018/012457 2017-04-04 2018-03-27 場所人気度推定システム WO2018186235A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019511171A JP6666521B2 (ja) 2017-04-04 2018-03-27 場所人気度推定システム
US16/346,387 US20190259073A1 (en) 2017-04-04 2018-03-27 Place popularity estimation system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017074673 2017-04-04
JP2017-074673 2017-04-04

Publications (1)

Publication Number Publication Date
WO2018186235A1 true WO2018186235A1 (ja) 2018-10-11

Family

ID=63712200

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/012457 WO2018186235A1 (ja) 2017-04-04 2018-03-27 場所人気度推定システム

Country Status (3)

Country Link
US (1) US20190259073A1 (ja)
JP (1) JP6666521B2 (ja)
WO (1) WO2018186235A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020102161A (ja) * 2018-12-25 2020-07-02 株式会社 ミックウェア 推定装置、レコメンドシステム、推定プログラムおよび推定方法
WO2021241154A1 (ja) * 2020-05-26 2021-12-02 株式会社Nttドコモ Poi人気度導出装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11289070B2 (en) * 2018-03-23 2022-03-29 Rankin Labs, Llc System and method for identifying a speaker's community of origin from a sound sample
WO2020014354A1 (en) 2018-07-10 2020-01-16 John Rankin System and method for indexing sound fragments containing speech
WO2021183421A2 (en) 2020-03-09 2021-09-16 John Rankin Systems and methods for morpheme reflective engagement response

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203270A (ja) * 2013-04-04 2014-10-27 日本電信電話株式会社 目的来店施設情報提供方法及び装置及びプログラム
JP2015014859A (ja) * 2013-07-04 2015-01-22 クラリオン株式会社 Poi情報提供システム、poi情報提供装置、poi情報出力装置、poi情報提供方法、及びプログラム
JP2015081919A (ja) * 2013-10-21 2015-04-27 トヨタ自動車株式会社 人気度に基づく旅行目的地の推定
JP2015225128A (ja) * 2014-05-26 2015-12-14 株式会社Nttドコモ 提示システム、提示装置、及び提示方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014203270A (ja) * 2013-04-04 2014-10-27 日本電信電話株式会社 目的来店施設情報提供方法及び装置及びプログラム
JP2015014859A (ja) * 2013-07-04 2015-01-22 クラリオン株式会社 Poi情報提供システム、poi情報提供装置、poi情報出力装置、poi情報提供方法、及びプログラム
JP2015081919A (ja) * 2013-10-21 2015-04-27 トヨタ自動車株式会社 人気度に基づく旅行目的地の推定
JP2015225128A (ja) * 2014-05-26 2015-12-14 株式会社Nttドコモ 提示システム、提示装置、及び提示方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020102161A (ja) * 2018-12-25 2020-07-02 株式会社 ミックウェア 推定装置、レコメンドシステム、推定プログラムおよび推定方法
WO2021241154A1 (ja) * 2020-05-26 2021-12-02 株式会社Nttドコモ Poi人気度導出装置
JP7489459B2 (ja) 2020-05-26 2024-05-23 株式会社Nttドコモ Poi人気度導出装置

Also Published As

Publication number Publication date
JP6666521B2 (ja) 2020-03-13
JPWO2018186235A1 (ja) 2019-07-04
US20190259073A1 (en) 2019-08-22

Similar Documents

Publication Publication Date Title
WO2018186235A1 (ja) 場所人気度推定システム
US9959321B2 (en) Ranking search results by social relevancy
CN110619076B (zh) 一种搜索词推荐方法、装置、计算机及存储介质
US20220351721A1 (en) Speech interaction method, apparatus, device and computer storage medium
WO2020199662A1 (zh) 用于推送信息的方法和装置
JP4950508B2 (ja) 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム
CN107767153B (zh) 一种数据处理方法及装置
CN114422267B (zh) 流量检测方法、装置、设备及介质
US11068479B2 (en) Method and system for analytic based connections among user types in an online platform
CN109034199B (zh) 数据处理方法及装置、存储介质和电子设备
EP4044044A1 (en) Method and apparatus for processing information
JP2018055525A (ja) テキスト抽出装置
CN110083677B (zh) 联系人的搜索方法、装置、设备及存储介质
CN113590756A (zh) 信息序列生成方法、装置、终端设备和计算机可读介质
US20200403955A1 (en) Systems and methods to prioritize chat rooms using machine learning
WO2019202782A1 (ja) 訪問先推定装置および訪問先推定方法
CN113742614A (zh) 生成、显示推荐信息的方法、电子设备及存储介质
JP2017204169A (ja) 事象判断装置
WO2019202791A1 (ja) 趣味嗜好推定装置および趣味嗜好推定方法
JP6809971B2 (ja) 名寄せ装置
CN108632456A (zh) 信息处理方法及信息处理系统
WO2020230524A1 (ja) 通行量推計システム
JP2017191456A (ja) 関連語抽出支援装置
EP4345653A1 (en) Information display apparatus, information display method, and information display program
JP2018055345A (ja) 優先順位決定装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18781637

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019511171

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18781637

Country of ref document: EP

Kind code of ref document: A1