WO2022105111A1 - 区域画像图生成方法、装置、计算机设备及存储介质 - Google Patents

区域画像图生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2022105111A1
WO2022105111A1 PCT/CN2021/090114 CN2021090114W WO2022105111A1 WO 2022105111 A1 WO2022105111 A1 WO 2022105111A1 CN 2021090114 W CN2021090114 W CN 2021090114W WO 2022105111 A1 WO2022105111 A1 WO 2022105111A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
information
data
activity
fault
Prior art date
Application number
PCT/CN2021/090114
Other languages
English (en)
French (fr)
Inventor
陈婷婷
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2022105111A1 publication Critical patent/WO2022105111A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Definitions

  • the present application relates to the field of data analysis of big data, and in particular, to a method, device, computer equipment and storage medium for generating a region portrait.
  • the present application provides a method, device, computer equipment and storage medium for generating a region portrait map, which realizes the rapid, accurate and scientific automatic generation of a region portrait map through the inverse distance weight method and the entropy value method.
  • the portrait map quickly predicts the demand distribution to meet the consumer demand of users.
  • a method for generating a region portrait map comprising:
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user basic information, the user driving information and the user maintenance log information are associated;
  • the activity index data of each cell in the standard grid area map is predicted, and at the same time according to The standard grid area map, the user basic information and the user maintenance log information associated with each of the user identifiers, and the fault index data of each of the unit grids are predicted;
  • the activity index data and the fault index data of all the cell squares are profiled to obtain a region portrait map; the region portrait map represents the user portrait distribution map of the region corresponding to the region information.
  • a device for generating a region portrait image comprising:
  • the receiving module is used to receive the portrait request, and obtain the area information, time period information and user information in the portrait request;
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user identification is respectively associated with one of the basic user information, one of the user's driving information and one of the user maintenance log information;
  • an acquisition module used for acquiring an area map matching the area information from a map database, and performing grid processing on the area map to obtain a standard grid area map;
  • the identification module is used for inputting each of the user's driving information associated with the user identification into the rim active model, and using the rim active model to identify the driving trajectory of each of the user's driving information, and obtain the corresponding information for each of the users.
  • a determining module configured to determine the activity data associated with the user identifier according to the user basic information associated with the user identifier and the user activity result corresponding thereto;
  • a prediction module used for predicting the activity of each cell in the standard grid area map according to all the activity data associated with the user ID and the standard grid area map through an inverse distance weighting method index data, and at the same time, according to the standard grid area map and the user basic information and the user maintenance log information associated with each of the user identifiers, predict the failure index data of each of the unit grids;
  • the portrait module is used to portrait the active index data and fault index data of all the cell squares through the entropy method to obtain an area portrait; the area portrait represents the users in the area corresponding to the area information Image distribution map.
  • a computer device comprising a memory, a processor, and computer-readable instructions stored in the memory and executable on the processor, the processor implementing the following steps when executing the computer-readable instructions:
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user basic information, the user driving information and the user maintenance log information are associated;
  • the activity index data of each cell in the standard grid area map is predicted, and at the same time according to The standard grid area map, the user basic information and the user maintenance log information associated with each of the user identifiers, and the fault index data of each of the unit grids are predicted;
  • the activity index data and the fault index data of all the cell squares are profiled to obtain a region portrait map; the region portrait map represents the user portrait distribution map of the region corresponding to the region information.
  • One or more readable storage media storing computer-readable instructions that, when executed by one or more processors, cause the one or more processors to perform the following steps:
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user basic information, the user driving information and the user maintenance log information are associated;
  • the activity index data of each cell in the standard grid area map is predicted, and at the same time according to The standard grid area map, the user basic information and the user maintenance log information associated with each of the user identifiers, and the fault index data of each of the unit grids are predicted;
  • the activity index data and the fault index data of all the cell squares are profiled to obtain a region portrait map; the region portrait map represents the user portrait distribution map of the region corresponding to the region information.
  • the method, device, computer equipment and storage medium for generating an area portrait map provided by this application, by receiving a portrait request, obtain the area information, time period information and user information in the portrait request; the user information includes user identification, user base information, user driving information and user maintenance log information; obtain an area map matching the area information from the map database, perform grid processing on the area map, and obtain a standard grid area map;
  • the user's driving information associated with the identifier is input into the rim activity model, and the vehicle rim activity model is used to identify the driving trajectory to obtain the user activity result; according to the user basic information associated with the user identifier and the corresponding
  • the activity result of the user is determined, and the activity data associated with the user identifier is determined; through the inverse distance weighting method, according to all the activity data and the standard grid area map, each area in the standard grid area map is predicted.
  • the activity indicator data of the cell and at the same time, according to the standard cell area map, the user basic information and the user maintenance log information associated with each user ID, the failure indicator of each cell is predicted. data; through the entropy value method, the active index data and fault index data of all the cell squares are profiled, and the regional portrait map is obtained. Scientifically and automatically generate regional portraits, which can quickly predict the demand distribution according to the regional portraits, so as to meet the consumption needs of users and improve the accuracy and reliability of identification.
  • FIG. 1 is a schematic diagram of an application environment of a method for generating a region portrait image in an embodiment of the present application
  • FIG. 2 is a flowchart of a method for generating a region portrait image in an embodiment of the present application
  • step S20 of a method for generating a region portrait image in an embodiment of the present application
  • step S30 is a flowchart of step S30 of a method for generating a region portrait image in an embodiment of the present application
  • step S40 of a method for generating a region portrait image in an embodiment of the present application
  • step S50 of a method for generating a region portrait image in an embodiment of the present application
  • step S50 of a method for generating a region portrait image in another embodiment of the present application.
  • step S60 is a flowchart of step S60 of a method for generating a region portrait image in an embodiment of the present application
  • FIG. 9 is a schematic block diagram of an apparatus for generating a region portrait image according to an embodiment of the present application.
  • FIG. 10 is a schematic diagram of a computer device in an embodiment of the present application.
  • the method for generating an area portrait map provided by the present application can be applied in the application environment as shown in FIG. 1 , wherein the client (computer device) communicates with the server through the network.
  • the client computer equipment
  • the server includes but is not limited to various personal computers, notebook computers, smart phones, tablet computers, cameras and portable wearable devices.
  • the server can be implemented as an independent server or a server cluster composed of multiple servers.
  • a method for generating a region portrait image is provided, and its technical solution mainly includes the following steps S10-S60:
  • S10 Receive a portrait request, and obtain area information, time period information, and user information in the portrait request; the user information includes a user ID, basic user information, user driving information, and user maintenance log information; one of the user IDs respectively Associated with one of the user basic information, one of the user's driving information and one of the user maintenance log information.
  • the portrait request includes the area information, the time period information and the user information
  • the area information is the information of the area where the area portrait needs to be performed
  • the time period information is the time period range where the area portrait needs to be performed information, such as May 2020, January to June 2020, etc.
  • the user information is the information of the selected user, and the user information can be obtained by obtaining the region information and the time period information in the database.
  • the initial data of the driving track of the vehicle corresponding to the user collected by the application software in Number of vehicle repairs, items per vehicle repair, etc.
  • S20 Obtain an area map matching the area information from a map database, and perform grid processing on the area map to obtain a standard grid area map.
  • the area map is a topographic map of a certain area
  • the area maps of all areas are stored in the map database
  • one of the area maps is associated with an area name.
  • the area map associated with the area name matched by the area information, the grid processing is to take the east and west boundaries of the area map as the length, and the north and south boundaries as the width, according to the parameters of the preset unit grid, divided into
  • the map can be divided into several unit squares, so as to obtain the standard grid area map corresponding to the area map.
  • step S20 that is, the grid processing of the area map to obtain a standard grid area map, including:
  • S201 according to the parameters of the preset unit grid, perform grid division on the area map to obtain each of the unit squares.
  • the parameters of the preset unit grid can be set according to requirements, preferably 100 ⁇ 100km, and the grid is divided into the minimum unit division of the regional map according to the preset unit grid, Get each of the cell squares under the area map, and the cell squares will be assigned a sequence number, starting from 1.
  • the center point of the unit square and the center coordinates corresponding to the center point can be calculated.
  • the standard grid area map is formed by splicing according to the longitude and latitude of the center coordinates of each of the unit squares.
  • the present application realizes that the area map is divided into grids according to the parameters of the preset unit grid to obtain each of the unit squares; according to the coordinates of each of the unit squares, the corresponding unit squares are determined. According to the center coordinates corresponding to each of the unit squares, merge all the unit squares to obtain the standard grid area map, so that the area map is divided into standard rooms containing several unit squares
  • the grid area map can be gridded to facilitate subsequent index analysis and prediction.
  • S30 Input each of the user's driving information associated with the user identifier into a rim active model, and perform a driving track identification on each of the user's driving information by using the rim active model, and obtain a vehicle corresponding to each of the user identifiers. of user active results.
  • the rim activity model realizes the driving trajectory recognition of the user's driving information associated with the user identification, obtains driving trajectory data, and then automatically recognizes the model of the user's activity result through active site recognition
  • the driving track is identified by performing latitude and longitude analysis on the GPS signaling data in the user driving information corresponding to the user identification through the rim activity model, and by staying in the time period within the tolerance range of the same longitude and latitude and with the latitude and longitude.
  • the trajectories that change with time change identify the driving track data corresponding to each of the user IDs, so that the residence source data, work source data and activity data corresponding to one of the user IDs can be identified, and the active place is identified as passing through the user ID.
  • the rim activity model extracts the location features in the driving track data, identifies each location corresponding to the user ID, and the coordinates corresponding to each location, and determines each location and the coordinates corresponding to each location as the location. Describe the user activity results.
  • the user activity result indicates the place where the user is active, and the active place is defined and coordinates are determined.
  • the driving track identification is performed on the driving information of each user through the rim activity model, and a user corresponding to each user identification is obtained.
  • Active results including:
  • the GPS signaling data is the positioning data of the user authorized by the user
  • the positioning data is the longitude and latitude data of the user at each time point
  • the longitude and latitude are resolved as the time within the tolerance range of the same longitude and latitude by staying.
  • the driving track data corresponding to each of the user identifiers is identified by the track segment and the trajectories of the latitude and longitude changing with time.
  • S302 Perform active place identification on all the driving track data by using the rim active model, and obtain coordinate results of each place corresponding to the user identifier.
  • the active place is identified by extracting the place features in the driving track data through the rim active model, identifying each place corresponding to the user ID, and the coordinates corresponding to each place, and identifying each place.
  • the locations and the coordinates corresponding to the respective locations are determined as the user activity results.
  • S303 Determine the coordinate result of each place corresponding to the user identifier as the user activity result corresponding to the user identifier.
  • the present application realizes the longitude and latitude analysis of the GPS signaling data in the user driving information corresponding to the user identification through the rim activity model, and identifies the driving track data corresponding to each user identification;
  • the vehicle rim active model performs active site identification on all the driving track data, and obtains the coordinate results of each site corresponding to the user ID; the coordinate results of each site corresponding to the user ID are determined as The user activity results corresponding to the identifiers are identified.
  • latitude and longitude analysis and identification, as well as active site identification the user activity results of users in various places can be accurately and quickly identified, which can provide information for subsequent generation of regional portraits. Based on data, the accuracy and quality of identification are improved.
  • S40 Determine activity data associated with the user identifier according to the basic user information associated with the user identifier and the corresponding user activity result.
  • NLP Natural Language Processing, Natural Language Processing
  • the NLP technology is an important process of converting natural language into computer language for analysis, understanding and extracting information from text, such as automatic summarization.
  • machine translation, named entity recognition, relationship extraction, speech recognition and topic segmentation, etc. identify residence information, work information and preference information from the user basic information associated with the user ID, and the identified residence information Information
  • the work information and the preference information are standardized, and the standardized process is to combine the recognized information into text, and convert the text into word vectors, and then perform conversion processing according to the converted word vectors in the same dimension. , so as to obtain residence source data corresponding to the residence information, work source data corresponding to the work information, and preference source data corresponding to the preference information.
  • the user activity result includes residence result, workplace result, and activity location result corresponding to the user identification
  • the residence source data and residence result are subjected to residence weighting processing to obtain the result corresponding to the residence weight.
  • the work weighting parameter the work source data and the workplace result are subjected to work weighting processing to obtain the work processing data associated with the user ID
  • the preference weighting parameter the preference The source data and the activity venue result are subjected to preference weighting processing to obtain activity processing data associated with the user identification, the activity data.
  • step S40 that is, according to the user basic information associated with the user identifier and the corresponding user activity result, determine whether the user identifier is associated with the user identifier.
  • Linked Active Data including:
  • named entity recognition is performed from the user basic information associated with the user identification, and the residence information, the work information and the preference information are obtained, that is, from the user ID. Identify residence-related entities in the basic information, so as to determine the residence information, such as family member information, and identify work-related entities from the user's basic information, so as to determine the work information, such as the working class is a white-collar worker , blue-collar or freelance information, and identify entities related to preferences from the basic user information, so as to determine the preference information, such as information related to personal preferences such as fishing and mountain climbing.
  • S402 Standardize the residence information, the work information, and the preference information to obtain residence source data corresponding to the residence information, work source data corresponding to the work information, and data corresponding to the preference information preference source data.
  • the standardization process is to combine the recognized information into texts, convert the texts into word vectors, and then perform conversion processing according to the converted word vectors in the same dimension, so as to obtain the residence information corresponding to the residence information.
  • source data, work source data corresponding to the work information, and preference source data corresponding to the preference information are examples of source data, work source data corresponding to the work information, and preference source data corresponding to the preference information.
  • the residence scoring algorithm is an algorithm for scoring according to the level to which the residence source data belongs, to score the residence source data and the results of the residence, and obtain an association with the user ID.
  • the residence processing data includes the residence score value and the coordinates of the residence place associated with it;
  • the work scoring algorithm is an algorithm for scoring according to the level to which the work source data belongs, to The work source data and the workplace results are scored to obtain the work processing data associated with the user identification, the work processing data including the work scoring value and the coordinates of the workplace associated with it, using a preference scoring algorithm , the preference scoring algorithm is an algorithm for scoring according to the content contained in the preference source data, scores the preference source data and the result of the activity venue, and obtains the activity processing data associated with the user ID,
  • the activity processing data includes activity score values and coordinates of activity venues associated therewith.
  • the user activity result includes a residence place result, a work place result and an activity place result corresponding to the user identification.
  • the present application realizes that residence information, work information and preference information are identified from the user basic information associated with the user identification; Residence source data corresponding to the residence information, work source data corresponding to the work information, and preference source data corresponding to the preference information; according to the residence source data and the result of the place of residence, it is determined that the user is related to the user Identify the associated residence processing data, determine the work processing data associated with the user ID according to the work source data and the workplace results, and determine the association with the user ID according to the preference source data and the activity site results
  • the residence information, work information and preference information are automatically identified from the user's basic information, and standardized processing is carried out, and the result of the residence place, the result of the work place and the activity are combined.
  • the venue results accurately measure the user's activity data and provide the user's activity data for each venue.
  • all the active data are marked on the standard grid area map, and the active index data of each of the cell squares are predicted, and at the same time according to all the user bases.
  • information and fault maintenance records in all user maintenance log information determine the fault score value associated with each of the fault coordinates, mark all the fault coordinates on the standard grid area map through the inverse distance weighting method, and The fault index data of each of the cell squares is predicted.
  • the inverse distance weight method is a fast and accurate deterministic interpolator.
  • the inverse distance weight method uses the distance between the interpolation point and the sample point as the weight to perform a weighted average. The closer the sample point to the interpolation point is, the greater the weight is.
  • the calculation formula of the active index data is:
  • Z(s0) is the activity index data of the center coordinate (s0) of the cell; N is the number of users around the center coordinate; Z(Si) is the user in the cell and in the active data
  • p is the preset user index value, preferably 2; di0 is the distance between the center coordinate (S0) and the user sample point (Si); the sum of the weights of all user sample points in a cell is 1 ,Right now
  • Y(s0) is the fault index data of the center coordinate (s0) of the cell; n is the number of fault coordinates around the center coordinate; Y(Tk) is the fault score of the fault coordinate data in the cell value; Tk is each fault coordinate in the cell; ⁇ k is the weight of the fault coordinate, the value decreases with the increase of the distance between the fault coordinate (Tk) and the center coordinate (s0) of the cell; each fault coordinate
  • the weight ⁇ k is:
  • q is the preset coordinate index value, preferably 2; Dk0 is the distance between the center coordinate (s0) and the known sample point (Tk); the sum of the weights of all coordinate sample points in a cell is 1, i.e.
  • the inverse distance weighting method is used to predict the standard grid according to all the activity index data and the standard grid area map.
  • Activity indicator data for each cell in the regional map including:
  • the coordinates of all the living places, the coordinates of all the workplaces and the coordinates of all the activity places in the activity data are marked in the standard grid area map.
  • the residence processing data in all the activity data is input into the calculation formula of the activity index data, and each cell is calculated by the residence score value in the residence processing data.
  • the activity index value of each cell square is calculated.
  • S503 Determine the residence index value, the work index value, and the activity index value of each unit square as the activity index data.
  • the present application realizes that the coordinates corresponding to the active data are marked in the standard grid area map; the residential index value, work index value and activity index value of each unit square are predicted by the inverse distance weight method; thus It is determined that the activity indicator data is given, so that the inverse distance weight method can be used to accurately insert each indicator value into each cell, and the active indicator data of each cell can be scientifically and objectively measured.
  • step S50 that is, according to the standard grid area map and the user basic information and the user maintenance log information associated with each of the user identifiers , to predict the fault index data of each of the cell squares, including:
  • S504 Identify the fault coordinates one-to-one corresponding to the fault location from all the fault locations in the user maintenance log information associated with the user identification; the user maintenance log information includes the fault location and The fault maintenance record corresponding to the fault location.
  • the user maintenance log information includes the fault location and the fault maintenance records corresponding to the fault location.
  • the fault coordinates are the longitude and latitude coordinates determined and given according to the fault location, and the fault maintenance record is the number of vehicle maintenance and the matters of each vehicle maintenance.
  • fault-related data is identified from the basic user information, and the fault-related data is data that has a certain risk with the fault, such as job position, work nature, etc., through which the fault-related data can be mined.
  • An entity with a certain potential relationship combined with the fault-related data and the fault maintenance record, uses a fault scoring algorithm to score each of the fault locations, and obtains the fault score value associated with it.
  • the fault scoring algorithm is: An algorithm for coding the fault-related data, and then scoring according to the coded value and the level of each fault maintenance record.
  • the present application realizes that the fault coordinates corresponding to the fault locations one-to-one are identified from all the fault locations in the user maintenance log information associated with the user identification;
  • the basic information and the fault maintenance record corresponding to the fault location determine the fault score value associated with the fault coordinates corresponding to the fault location; through the inverse distance weighting method, according to the standard grid area map and For all the fault score values, the fault index data of each cell can be predicted, so that the fault coordinates can be automatically identified, and the fault index data of each cell can be automatically predicted by the inverse distance weight method.
  • the activity index data and the fault index data of all the cell squares are profiled to obtain a region portrait map;
  • the region portrait map represents the user portrait distribution map of the region corresponding to the region information .
  • the entropy value method is an objective weighting method, and the weight of the indicators is determined according to the degree of connection of each indicator and the amount of information provided by each indicator.
  • H vj is the index entropy value corresponding to the second serial number in the first cell; m is the total number of all the cell; M is the total number of index data in the cell; v is the The sequence number of the cell in the standard grid area map; j is the sequence number of the indicator data in the cell (for example, 1 is the active indicator data, 2 is the fault indicator data); x vj is the same as the vth cell and The index coefficient corresponding to the jth serial number, the index coefficient is:
  • L vj is the indicator data corresponding to the vth cell square and the jth serial number.
  • L11 is the indicator data (active indicator data) of the first serial number in the first cell square
  • L12 is the same as the first cell.
  • the indicator data fault indicator data corresponding to the second serial number in each cell square.
  • w vj is the index entropy weight corresponding to the vth unit square and the jth serial number.
  • a v is the final portrait index value corresponding to the vth cell square.
  • the present application realizes the acquisition of the region information, time period information and user information in the portrait request by receiving the portrait request;
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user identification is respectively associated with one of the basic user information, one of the user's driving information and one of the user's maintenance log information; an area map matching the area information is obtained from the map database, and the area map is gridded.
  • the region information, time period information and user information in the portrait request are obtained;
  • the user information includes user identification, user basic information, user driving information and user maintenance log information; from the map database Obtain an area map that matches the area information, perform grid processing on the area map, and obtain a standard grid area map; input the user driving information associated with the user ID into the rim active model , identify the driving trajectory through the rim activity model, and obtain the user activity result; according to the user basic information associated with the user identifier and the corresponding user activity result, determine the user activity associated with the user identifier.
  • Activity data through the inverse distance weighting method, according to all the activity data and the standard grid area map, predict the activity index data of each cell in the standard grid area map, and at the same time according to the standard grid area map.
  • the grid area map, the user basic information and the user maintenance log information associated with each of the user identifiers, and the fault index data of each of the unit cells are predicted;
  • the active indicator data and fault indicator data are profiled to obtain a regional portrait.
  • the inverse distance weight method and entropy method can be used to automatically generate regional portraits quickly, accurately and scientifically.
  • the demand distribution is predicted to meet the consumer demand of users and improve the accuracy and reliability of identification.
  • the entropy method is used to profile the activity indicator data and fault indicator data of all the cell squares to obtain a regional profile diagram, including: :
  • S601 Calculate the index entropy value and the index entropy weight corresponding to each portrait index according to the activity index data and the fault index data of all the unit squares by the entropy value method.
  • the activity indicator data and the fault indicator data of all the cells are input into the calculation formula of the index entropy value and the calculation formula of the index entropy weight, whereby, the index entropy value and index entropy weight of each of the portrait indicators are obtained, the portrait index refers to the index dimension of the portrait, and the portrait index includes the active index corresponding to the active index data and the corresponding fault index data. failure indicator.
  • index entropy values and the index entropy weights are input into the calculation formula of the final portrait index value, and the final portrait index value of each of the cell squares is calculated.
  • S603 Map the final portrait index values of each of the unit squares to the area map one by one to obtain the area portrait map.
  • the final portrait index value of each of the cell squares is mapped to the area map one by one according to the sequence number of the corresponding unit square, so that the mapped area map is determined as the image of the area described above.
  • the present application realizes that through the entropy method, the index entropy value and the index entropy weight corresponding to each portrait index are calculated according to the active index data and fault index data of all the cell squares; according to all the index entropy values and the index entropy weight, determine the final portrait index value of each described unit square; map the final portrait index value of each described unit square to the area map one by one to obtain the area portrait
  • the final portrait index value of each cell can be scientifically and accurately measured, and mapped to the regional map, so as to obtain the regional portrait map, which can be automatically generated quickly, accurately and scientifically.
  • the regional portrait map can quickly predict the demand distribution according to the regional portrait map, so as to meet the consumer demand of users and improve the accuracy and reliability of identification.
  • a device for generating a region portrait map is provided, and the device for generating a region portrait map corresponds one-to-one with the method for generating a region portrait map in the above-mentioned embodiment.
  • the device for generating a regional portrait image includes a receiving module 11 , an acquiring module 12 , an identifying module 13 , a determining module 14 , a predicting module 15 and a portrait module 16 .
  • the detailed description of each functional module is as follows:
  • the receiving module 11 is used to receive the portrait request, and obtain the area information, time period information and user information in the portrait request;
  • the user information includes user identification, user basic information, user driving information and user maintenance log information;
  • the user identifiers are respectively associated with one of the basic user information, one of the user's driving information and one of the user maintenance log information;
  • an acquisition module 12 configured to acquire an area map matching the area information from a map database, perform grid processing on the area map, and obtain a standard grid area map;
  • the identification module 13 is used for inputting each of the user's driving information associated with the user identification into the rim active model, and performing the driving trajectory recognition on each of the user's driving information through the rim active model, and obtains the information related to each vehicle. the user activity result corresponding to the user ID;
  • a determination module 14 configured to determine the activity data associated with the user identifier according to the user basic information associated with the user identifier and the user activity result corresponding thereto;
  • the prediction module 15 is used to predict, through the inverse distance weighting method, according to all the active data associated with the user ID and the standard grid area map, the prediction value of each cell in the standard grid area map. Active indicator data, and at the same time predict the failure indicator data of each of the cell grids according to the standard grid area map, the basic user information and the user maintenance log information associated with each of the user identifiers;
  • the portrait module 16 is used to portrait the active index data and fault index data of all the cell squares through the entropy method to obtain an area portrait; the area portrait represents the area corresponding to the area information.
  • User portrait distribution map is used to portrait the active index data and fault index data of all the cell squares through the entropy method to obtain an area portrait; the area portrait represents the area corresponding to the area information.
  • each module in the above-mentioned device for generating a region portrait map can be implemented by software, hardware and combinations thereof.
  • the above modules can be embedded in or independent of the processor in the computer device in the form of hardware, or stored in the memory in the computer device in the form of software, so that the processor can call and execute the operations corresponding to the above modules.
  • a computer device is provided, and the computer device may be a server, and its internal structure diagram may be as shown in FIG. 10 .
  • the computer device includes a processor, memory, a network interface, and a database connected by a system bus. Among them, the processor of the computer device is used to provide computing and control capabilities.
  • the memory of the computer device includes a readable storage medium, an internal memory.
  • the readable storage medium stores an operating system, computer readable instructions and a database.
  • the internal memory provides an environment for the execution of the operating system and computer-readable instructions in the readable storage medium.
  • the network interface of the computer device is used to communicate with external terminals through a network connection.
  • the computer-readable instructions when executed by the processor, implement a method for generating a region portrait.
  • the readable storage medium provided by this embodiment includes a non-volatile readable storage medium and a volatile readable storage medium.
  • one or more readable storage media storing computer-readable instructions are provided, and the readable storage media provided in this embodiment include non-volatile readable storage media and volatile readable storage media medium; computer-readable instructions are stored on the readable storage medium, and when the computer-readable instructions are executed by one or more processors, enable one or more processors to implement the method for generating a region portrait in the foregoing embodiment.
  • a computer-readable storage medium on which computer-readable instructions are stored, and when the computer-readable instructions are executed by a processor, the method for generating a region portrait in the foregoing embodiment is implemented.
  • Nonvolatile memory may include read only memory (ROM), programmable ROM (PROM), electrically programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), or flash memory.
  • Volatile memory may include random access memory (RAM) or external cache memory.
  • RAM is available in various forms such as static RAM (SRAM), dynamic RAM (DRAM), synchronous DRAM (SDRAM), double data rate SDRAM (DDRSDRAM), enhanced SDRAM (ESDRAM), synchronous chain Road (Synchlink) DRAM (SLDRAM), memory bus (Rambus) direct RAM (RDRAM), direct memory bus dynamic RAM (DRDRAM), and memory bus dynamic RAM (RDRAM), etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种区域画像图生成方法、装置、计算机设备及存储介质,所述方法包括:通过接收画像请求,获取画像请求中的区域信息、时间段信息和用户信息(S10);自地图数据库中获取与区域信息匹配的区域地图,对区域地图进行网格化处理,得到标准方格区域地图(S20);通过车圈活跃模型进行行车轨迹识别,得到用户活跃结果(S30);根据用户基础信息和户活跃结果,确定活跃数据(S40);通过反距离权重法,预测出活跃指标数据,同时根据标准方格区域地图和用户基础信息及用户维修日志信息,预测出故障指标数据(S50);通过熵值法,对所有活跃指标数据和故障指标数据进行画像,得到区域画像图(S60)。该方法实现了快速地、准确地、科学地自动生成区域画像图。

Description

区域画像图生成方法、装置、计算机设备及存储介质
本申请要求于2020年11月17日提交中国专利局、申请号为202011288140.5,发明名称为“区域画像图生成方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及大数据的数据分析领域,尤其涉及一种区域画像图生成方法、装置、计算机设备及存储介质。
背景技术
发明人发现随着移动互联网发展,大数据逐渐成为区域经济发展的新引擎,在移动互联网的发展过程中,如何在极短时间内预测出某一区域内人群的构成、特征、变化趋势,从而对该区域做出客观的画像,进而利用该画像更加科学合理地满足用户需求,成为当前的迫切需求。目前,对于一些区域的用户,比如,作为车主的用户来说,尚不存在准确科学的对该区域的车主进行全景画像的方法,可以对该区域的车主行为偏好进行准确画像。
发明内容
本申请提供一种区域画像图生成方法、装置、计算机设备及存储介质,实现了通过反距离权重法和熵值法,快速地、准确地、科学地自动生成区域画像图,能够根据生成的区域画像图快速预测出需求分布,从而满足用户的消费需求。
一种区域画像图生成方法,包括:
接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
一种区域画像图生成装置,包括:
接收模块,用于接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户 维修日志信息关联;
获取模块,用于自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
识别模块,用于将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
确定模块,用于根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
预测模块,用于通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
画像模块,用于通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如下步骤:
接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
本申请提供的区域画像图生成方法、装置、计算机设备及存储介质,通过接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型进行行车轨迹识别,得到用户活跃结果;根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;通过反距离权重法,根据所有所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图,如此,实现了通过反距离权重法和熵值法,快速地、准确地、科学地自动生成区域画像图,能够根据区域画像图快速预测出需求分布,从而满足用户的消费需求,提高了识别的准确率和可靠性。
本申请的一个或多个实施例的细节在下面的附图和描述中提出,本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例中区域画像图生成方法的应用环境示意图;
图2是本申请一实施例中区域画像图生成方法的流程图;
图3是本申请一实施例中区域画像图生成方法的步骤S20的流程图;
图4是本申请一实施例中区域画像图生成方法的步骤S30的流程图;
图5是本申请一实施例中区域画像图生成方法的步骤S40的流程图;
图6是本申请一实施例中区域画像图生成方法的步骤S50的流程图;
图7是本申请另一实施例中区域画像图生成方法的步骤S50的流程图;
图8是本申请一实施例中区域画像图生成方法的步骤S60的流程图;
图9是本申请一实施例中区域画像图生成装置的原理框图;
图10是本申请一实施例中计算机设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例, 都属于本申请保护的范围。
本申请提供的区域画像图生成方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种区域画像图生成方法,其技术方案主要包括以下步骤S10-S60:
S10,接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联。
可理解地,在需要对某一区域的某一时间段的用户进行画像识别出该区域画像图时,触发所述画像请求,通过所述区域画像图能够识别出该区域的用户的画像分布情况,所述画像请求包括所述区域信息、所述时间段信息和所述用户信息,所述区域信息为需要进行区域画像的区域的信息,所述时间段信息为需要进行区域画像的时间段范围的信息,比如2020年5月、2020年1月至6月等等,所述用户信息为选取的用户的信息,所述用户信息可以通过获取数据库中符合所述区域信息和所述时间段信息的所有用户的信息,也可以为选取的特定用户且符合所述区域信息和所述时间段信息的信息,所述用户信息包括所述用户标识以及均与所述用户标识关联的所述用户基础信息、所述用户行车信息和所述用户维修日志信息,所述用户标识为赋予用户的唯一标识码,所述用户标识可以根据需求设定,比如用户的身份证、用户的注册账号、用户的车牌号等等,所述用户基础信息为与用户的基本特征相关的信息,比如用户的性别、年龄、职业、车型等等,所述用户行车信息为经过用户授权且通过与用户对应的客户端中的应用程序软件采集到的与用户对应的车辆的行车轨迹初始数据,所述用户维修日志信息为与用户对应的车辆进行维修的相关信息,比如:车辆发生故障或者事故的时间及地点坐标、车辆维修次数、每次车辆维修的事项等等。
S20,自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图。
可理解地,所述区域地图为某一区域的地形图,所述地图数据库中存储了所有区域的区域地图,一个所述区域地图与一个区域名关联,从所述地图数据库中查找到与所述区域信息匹配的所述区域名关联的所述区域地图,所述网格化处理为以所述区域地图的东西边界作为长,南北边界作为宽,按照预设单元网格的参数,均分成各单元方格的处理过程,如此可以将地图划分成若干个单元方格,从而得到与所述区域地图对应的所述标准方格区域地图。
在一实施例中,如图3所示,所述步骤S20中,即所述对所述区域地图网格化处理,得到标准方格区域地图,包括:
S201,按照预设单元网格的参数,对所述区域地图进行网格划分,得到各所述单元方格。
可理解地,所述预设单元网格的参数可以根据需求设定,优选为100×100km,所述网格划分为按照所述预设单元网格对所述区域地图做最小单元的划分,得到所述区域地图下的各个所述单元方格,所述单元方格会被赋予一个顺序号,从1开始。
S202,根据各所述单元方格的坐标,确定与各所述单元方格对应的中心坐标。
可理解地,根据各个所述单元方格的四个点的经纬度坐标,可以计算出所述单元方格的中心点,以及与该中心点对应的中心坐标。
S203,根据与各所述单元方格对应的中心坐标,合并所有所述单元方格,得到所述标准方格区域地图。
可理解地,根据各所述单元方格的所述中心坐标的经纬度进行拼接,构成所述标准方格区域地图。
本申请实现了按照预设单元网格的参数,对所述区域地图进行网格划分,得到各所述单元方格;根据各所述单元方格的坐标,确定与各所述单元方格对应的中心坐标;根据与各所述单元方格对应的中心坐标,合并所有所述单元方格,得到所述标准方格区域地图,如此,将区域地图划分成含有若干个单元方格的标准房格区域地图,能够将该区域网格化,便于后续的指标分析和预测。
S30,将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果。
可理解地,所述车圈活跃模型实现了对与所述用户标识关联的所述用户行车信息进行行车轨迹识别,得到行车轨迹数据,再通过活跃场所识别,自动识别出用户活跃结果的模型,所述行车轨迹识别为通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,通过停留与相同经纬度公差范围内的时间段以及经纬度随时间变化而变化的轨迹识别出与各所述用户标识对应的行车轨迹数据,如此可以识别出与一个所述用户标识对应的居住源数据、工作源数据和活动数据,所述活跃场所识别为通过所述车圈活跃模型提取所述行车轨迹数据中的场所特征,识别出与所述用户标识对应的各个场所,以及与各个场所对应的坐标,将各个场所和与各个场所对应的坐标确定为所述用户活跃结果。
其中,所述用户活跃结果表明了用户活跃的场所,并对活跃的场所进行定义和坐标确定。
在一实施例中,如图4所示,所述步骤S30中,即所述通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果,包括:
S301,通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,识别出与各所述用户标识对应的行车轨迹数据。
可理解地,所述GPS信令数据为得到用户授权的用户的定位数据,所述定位数据为用户在每个时间点的经纬度数据,所述经纬度解析为通过停留与相同经纬度公差范围内的时间段以及经纬度随时间变化而变化的轨迹识别出与各所述用户标识对应的行车轨迹数据。
S302,通过所述车圈活跃模型对所有所述行车轨迹数据进行活跃场所识别,得到与所述用户标识对应的各场所的坐标结果。
可理解地,所述活跃场所识别为通过所述车圈活跃模型提取所述行车轨迹数据中的场所特征,识别出与所述用户标识对应的各个场所,以及与各个场所对应的坐标,将各个场所和与各个场所对应的坐标确定为所述用户活跃结果。
S303,将与所述用户标识对应的各场所的坐标结果确定为与所述用户标识对应的所述用户活跃结果。
本申请实现了通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,识别出与各所述用户标识对应的行车轨迹数据;通过所述车圈活跃模型对所有所述行车轨迹数据进行活跃场所识别,得到与所述用户标识对应的各场所的坐标结果;将与所述用户标识对应的各场所的坐标结果确定为与所述用户标识对应的所述用户活跃结果,如此,实现了通过经纬度解析和识别,以及活跃场所识别,能够准确地、快速地识别出用户在各个场所的用户活跃结果,能够为后续生成区域画像图提供了数据依据,提高了识别的准确率和质量。
S40,根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据。
可理解地,通过NLP(自然语言处理,Natural Language Processing)技术,所述NLP 技术为以一种将自然语言转换成计算机语言进行分析,理解和从文本中提取信息等重要的过程,比如自动摘要,机器翻译,命名实体识别,关系提取,语音识别和主题分割等,从与所述用户标识关联的所述用户基础信息中识别出居住信息、工作信息和喜好信息,对识别出的所述居住信息、所述工作信息和所述喜好信息进行标准化处理,所述标准化处理为将识别的信息进行合并文本,并对文本转换成词向量,再根据转换的词向量进行同一维度的标准进行转换处理,从而得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据。
其中,所述用户活跃结果包括与所述用户标识对应的居住场所结果、工作场所结果和活动场所结果,根据居住加权参数,对所述居住源数据和居住场所结果进行居住加权处理,得到与所述用户标识关联的居住加工数据;根据工作加权参数,对所述工作源数据和工作场所结果进行工作加权处理,得到与所述用户标识关联的工作加工数据,根据喜好加权参数,对所述喜好源数据和活动场所结果进行喜好加权处理,得到与所述用户标识关联的活动加工数据,所述活跃数据。
在一实施例中,如图5所示,所述步骤S40中,即所述根据与所述用户标识关联的所述用户基础信息和对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据,包括:
S401,从与所述用户标识关联的所述用户基础信息中识别出居住信息、工作信息和喜好信息。
可理解地,通过所述NLP技术,从与所述用户标识关联的所述用户基础信息中进行命名实体识别,得到所述居住信息、所述工作信息和所述喜好信息,即从所述用户基础信息中识别与居住相关的实体,从而确定出所述居住信息,比如家庭成员信息,从所述用户基础信息中识别与工作相关的实体,从而确定出所述工作信息,比如工薪阶级为白领、蓝领或自由职业等信息,从所述用户基础信息中识别与喜好相关的实体,从而确定出所述喜好信息,比如钓鱼、爬山等个人喜好相关的信息。
S402,对所述居住信息、所述工作信息和所述喜好信息进行标准化处理,得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据。
可理解地,所述标准化处理为将识别的信息进行合并文本,并对文本转换成词向量,再根据转换的词向量进行同一维度的标准进行转换处理,从而得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据。
S403,根据所述居住源数据和居住场所结果,确定出与所述用户标识关联的居住加工数据,根据所述工作源数据和工作场所结果,确定出与所述用户标识关联的工作加工数据,根据所述喜好源数据和活动场所结果,确定出与所述用户标识关联的活动加工数据;其中,所述用户活跃结果包括与所述用户标识对应的居住场所结果、工作场所结果和活动场所结果。
可理解地,运用居住评分算法,所述居住评分算法按照所述居住源数据所属的等级进行评分的算法,对所述居住源数据和所述居住场所结果进行评分,得到与所述用户标识关联的所述居住加工数据,所述居住加工数据包括居住评分值及与其关联的居住场所的坐标;运用工作评分算法,所述工作评分算法按照所述工作源数据所属的等级进行评分的算法,对所述工作源数据和所述工作场所结果进行评分,得到与所述用户标识关联的所述工作加工数据,所述工作加工数据包括工作评分值及与其关联的工作场所的坐标,运用喜好评分算法,所述喜好评分算法按照所述喜好源数据所包含的内容进行评分的算法,对所述喜好源数据和所述活动场所结果进行评分,得到与所述用户标识关联的所述活动加工数据,所述活动加工数据包括活动评分值及与其关联的活动场所的坐标。
其中,所述用户活跃结果包括与所述用户标识对应的居住场所结果、工作场所结果和 活动场所结果。
S404,将与所述用户标识关联的所述居住加工数据、所述工作加工数据和所述活动加工数据确定为与所述用户标识关联的所述活跃数据。
本申请实现了通过从与所述用户标识关联的所述用户基础信息中识别出居住信息、工作信息和喜好信息;对所述居住信息、所述工作信息和所述喜好信息进行标准化处理,得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据;根据所述居住源数据和居住场所结果,确定出与所述用户标识关联的居住加工数据,根据所述工作源数据和工作场所结果,确定出与所述用户标识关联的工作加工数据,根据所述喜好源数据和活动场所结果,确定出与所述用户标识关联的活动加工数据,从而确定出所述活跃数据,如此,实现了通过用户基础信息中自动识别出居住信息、工作信息和喜好信息,并进行标准化处理,以及结合居住场所结果、工作场所结果和活动场所结果,准确地衡量出用户的活跃数据,提供了用户各个场所的活跃数据。
S50,通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据。
可理解地,通过所述反距离权重法,在所述标准方格区域地图上标记所有所述活跃数据,预测出各所述单元方格的所述活跃指标数据,同时根据所有所述用户基础信息和所有用户维修日志信息中的故障维修记录,确定出与各所述故障坐标关联的故障评分值,通过反距离权重法,在所述标准方格区域地图上标记所有所述故障坐标,并预测出各所述单元方格的所述故障指标数据。
其中,所述反距离权重法(IDW)是一个快速精确的确定性插值器,在实际应用中,基于相近相似的原理(两个物体离得近,性质就越相似),所述反距离权重法以插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大,所述活跃指标数据的计算公式为:
Figure PCTCN2021090114-appb-000001
其中,Z(s0)为单元方格的中心坐标(s0)的活跃指标数据;N为中心坐标周围用户的数量;Z(Si)为在该单元方格内且在所述活跃数据中的用户的评分值;Si为在单元方格内且在所述活跃数据中的用户,即该单元方格的用户样点;λi为各用户样点的权重,该值随用户样点(Si)和单元方格的中心坐标(s0)之间距离的增加而减少;各样点的权重λi为:
Figure PCTCN2021090114-appb-000002
其中,p为预设的用户指数值,优选为2;di0为中心坐标(S0)与用户样点(Si)之间的距离;一个单元方格内的所有用户样点的权重之和为1,即
Figure PCTCN2021090114-appb-000003
所述故障指标数据的计算公式为:
Figure PCTCN2021090114-appb-000004
其中,Y(s0)为单元方格的中心坐标(s0)的故障指标数据;n为中心坐标周围故障坐标的数量;Y(Tk)为在单元方格内的所述故障坐标数据的故障评分值;Tk为在单元方格内 的各故障坐标;βk为故障坐标的权重,该值随故障坐标(Tk)和单元方格的中心坐标(s0)之间距离的增加而减少;各故障坐标的权重βk为:
Figure PCTCN2021090114-appb-000005
其中,q为预设的坐标指数值,优选为2;Dk0为中心坐标(s0)与已知样点(Tk)之间的距离;一个单元方格内的所有坐标样点的权重之和为1,即
Figure PCTCN2021090114-appb-000006
在一实施例中,如图6所示,所述步骤S50中,即所述通过反距离权重法,根据所有所述活跃指标数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,包括:
S501,将所述标准方格区域地图中标记出所述活跃数据对应的坐标。
可理解地,在所述标准方格区域地图中标记所述活跃数据中的所有所述居住场所的坐标、所有所述工作场所的坐标和所有所述活动场所的坐标。
S502,通过反距离权重法,对所有所述活跃数据中的所述居住加工数据进行预测,得到各单元方格的居住指标值;对所有所述活跃数据中的所述工作加工数据进行预测,得到各单元方格的工作指标值;对所有所述活跃数据中的所述活动加工数据进行预测,得到各单元方格的活动指标值。
可理解地,通过所述反距离权重法,将所有所述活跃数据中所述居住加工数据输入活跃指标数据的计算公式中,通过所述居住加工数据中的居住评分值计算出各单元方格的所述居住指标值;通过所述反距离权重法,将所有所述活跃数据中所述工作加工数据输入活跃指标数据的计算公式中,通过所述工作加工数据中的工作评分值计算出各单元方格的所述工作指标值;通过所述反距离权重法,将所有所述活跃数据中所述活动加工数据输入活跃指标数据的计算公式中,通过所述活动加工数据中的活动评分值计算出各单元方格的所述活动指标值。
S503,将所述各单元方格的所述居住指标值、所述工作指标值和所述活动指标值确定为所述活跃指标数据。
本申请实现了通过将所述标准方格区域地图中标记出所述活跃数据对应的坐标;通过反距离权重法,预测出各单元方格的居住指标值、工作指标值和活动指标值;从而确定给出所述活跃指标数据,如此,实现了通过反距离权重法,能够准确地对各单元方格插入各个指标值,能够科学地、客观地衡量出各单元方格的活跃指标数据。
在一实施例中,如图7所示,所述步骤S50中,即所述根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据,包括:
S504,从与所述用户标识关联的所述用户维修日志信息中的所有故障地点中识别出与所述故障地点一一对应的故障坐标;所述用户维修日志信息包括所述故障地点以及均与所述故障地点对应的故障维修记录。
可理解地,所述用户维修日志信息包括所述故障地点以及均与所述故障地点对应的故障维修记录,所述故障地点为发生故障的位置,与其有一一对应的所述故障坐标,所述故障坐标为根据所述故障地点确定给出的经纬度坐标,所述故障维修记录为车辆维修次数和每次车辆维修的事项。
S505,根据与所述用户标识关联的所述用户基础信息和与所述故障地点对应的所述故障维修记录,确定出与所述故障地点对应的所述故障坐标关联的故障评分值。
可理解地,从所述用户基础信息中识别出故障关联数据,所述故障关联数据为与故障 存在一定风险的数据,比如工作职位、工作性质等,通过所述故障关联数据可以挖掘出与故障存在一定潜在关系的实体,结合所述故障关联数据和所述故障维修记录,运用故障评分算法,对各所述故障地点进行评分,得到与其关联的所述故障评分值,所述故障评分算法为对所述故障关联数据进行编码,然后根据编码的值与各所述故障维修记录的等级进行评分的算法。
S506,通过反距离权重法,根据所述标准方格区域地图和所有所述故障评分值,预测出各所述单元方格的所述故障指标数据。
可理解地,运用所述反距离权重法,在所述标准方格区域地图中的各所述单元方格中将所有所述故障评分值输入所述故障指标数据的计算公式中,预测出与所述单元方格对应的所述故障指标数据,并且在所述标准方格区域地图中的各所述单元方格中进行标记。
本申请实现了通过从与所述用户标识关联的所述用户维修日志信息中的所有故障地点中识别出与所述故障地点一一对应的故障坐标;根据与所述用户标识关联的所述用户基础信息和与所述故障地点对应的所述故障维修记录,确定出与所述故障地点对应的所述故障坐标关联的故障评分值;通过反距离权重法,根据所述标准方格区域地图和所有所述故障评分值,预测出各所述单元方格的所述故障指标数据,如此,能够自动识别出故障坐标,并通过反距离权重法自动预测出各个单元方格的故障指标数据。
S60,通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
可理解地,所述熵值法是一种客观赋权的方法,根据各指标的联系程度以及各指标所提供的信息量来决定指标的权重,所述熵值法通过指标熵值和指标熵权计算出各个所述单元方格的最终画像指标值,根据所有与所述最终画像指标值对应的所述单元方格,映射至所述区域地图中,得到所述区域画像图,获取到与所述画像请求对应的所述区域画像图之后,从所述区域画像图中识别出与各单元方格对应区域的画像值中进行区段划分,对划分后的区段进行不同颜色的标记,根据不同区段,预测出与其对应的汽车美容、汽车保养、汽车洗车服务的设置数,从而可以科学的预测出各个区域的汽车消费需求,如此,满足了用户在汽车消费上的需求,提高了识别的准确率和可靠性。
其中,所述指标熵值的计算公式为:
Figure PCTCN2021090114-appb-000007
其中,H vj为与第1个单元方格中第2序号对应的指标熵值;m为所有所述单元方格的总数;M为所述单元方格中指标数据的总数;v为所述标准方格区域地图中的单元方格的顺序号;j为单元方格中指标数据的序号(比如1为活跃指标数据,2为故障指标数据);x vj为与第v个单元方格且第j序号对应的指标系数,所述指标系数为:
Figure PCTCN2021090114-appb-000008
其中,L vj为与第v个单元方格且第j序号对应的指标数据,比如L 11为第1个单元方格中第1序号的指标数据(活跃指标数据),L 12为与第1个单元方格中第2序号对应的指标数据(故障指标数据)。
所述指标熵权的计算公式为:
Figure PCTCN2021090114-appb-000009
其中,w vj为与第v个单元方格且第j序号对应的指标熵权。
所述最终画像指标值的计算公式为:
Figure PCTCN2021090114-appb-000010
其中,A v为与第v个单元方格对应的最终画像指标值。
本申请实现了通过接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图。
如此,实现了通过接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型进行行车轨迹识别,得到用户活跃结果;根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;通过反距离权重法,根据所有所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图,如此,实现了通过反距离权重法和熵值法,快速地、准确地、科学地自动生成区域画像图,能够根据区域画像图快速预测出需求分布,从而满足用户的消费需求,提高了识别的准确率和可靠性。
在一实施例中,如图8所示,所述步骤S60中,即所述通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图,包括:
S601,通过所述熵值法,根据所有所述单元方格的活跃指标数据和故障指标数据,计算出与各画像指标对应的指标熵值和指标熵权。
可理解地,通过所述熵值法,将所有所述单元方格的所述活跃指标数据和所述故障指标数据输入所述指标熵值的计算公式和所述指标熵权的计算公式中,从而得到各个所述画像指标的指标熵值和指标熵权,所述画像指标指进行画像的指标维度,所述画像指标包括与所述活跃指标数据对应的活跃指标和与所述故障指标数据对应的故障指标。
S602,根据所有所述指标熵值和所述指标熵权,确定出各所述单元方格的最终画像指 标值。
可理解地,将所有所述指标熵值和所述指标熵权输入所述最终画像指标值的计算公式中,计算出各所述单元方格的所述最终画像指标值。
S603,将各所述单元方格的所述最终画像指标值一一映射至所述区域地图中,得到所述区域画像图。
可理解地,将各所述单元方格的所述最终画像指标值根据与其对应的单元方格的顺序号一一映射至所述区域地图中,从而将映射完的所述区域地图确定为所述区域画像图。
本申请实现了通过所述熵值法,根据所有所述单元方格的活跃指标数据和故障指标数据,计算出与各画像指标对应的指标熵值和指标熵权;根据所有所述指标熵值和所述指标熵权,确定出各所述单元方格的最终画像指标值;将各所述单元方格的所述最终画像指标值一一映射至所述区域地图中,得到所述区域画像图,如此,通过熵值法,能够科学地、准确地衡量出各个单元方格的最终画像指标值,并映射至区域地图中,从而得到区域画像图,快速地、准确地、科学地自动生成区域画像图,能够根据区域画像图快速预测出需求分布,从而满足用户的消费需求,提高了识别的准确率和可靠性。在一实施例中,提供一种区域画像图生成装置,该区域画像图生成装置与上述实施例中区域画像图生成方法一一对应。如图9所示,该区域画像图生成装置包括接收模块11、获取模块12、识别模块13、确定模块14、预测模块15和画像模块16。各功能模块详细说明如下:
接收模块11,用于接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
获取模块12,用于自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
识别模块13,用于将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
确定模块14,用于根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
预测模块15,用于通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
画像模块16,用于通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
关于区域画像图生成装置的具体限定可以参见上文中对于区域画像图生成方法的限定,在此不再赘述。上述区域画像图生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。该计 算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种区域画像图生成方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一个或多个存储有计算机可读指令的可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质;该可读存储介质上存储有计算机可读指令,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器实现上述实施例中区域画像图生成方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现上述实施例中区域画像图生成方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质或易失性可读存储介质中,,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (20)

  1. 一种区域画像图生成方法,其中,包括:
    接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
    自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
    将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
    根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
    通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
    通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
  2. 如权利要求1所述的区域画像图生成方法,其中,所述对所述区域地图网格化处理,得到标准方格区域地图,包括:
    按照预设单元网格的参数,对所述区域地图进行网格划分,得到各所述单元方格;
    根据各所述单元方格的坐标,确定与各所述单元方格对应的中心坐标;
    根据与各所述单元方格对应的中心坐标,合并所有所述单元方格,得到所述标准方格区域地图。
  3. 如权利要求1所述的区域画像图生成方法,其中,所述通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果,包括:
    通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,识别出与各所述用户标识对应的行车轨迹数据;
    通过所述车圈活跃模型对所有所述行车轨迹数据进行活跃场所识别,得到与所述用户标识对应的各场所的坐标结果;
    将与所述用户标识对应的各场所的坐标结果确定为与所述用户标识对应的所述用户活跃结果。
  4. 如权利要求1所述的区域画像图生成方法,其中,所述根据与所述用户标识关联的所述用户基础信息和对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据,包括:
    从与所述用户标识关联的所述用户基础信息中识别出居住信息、工作信息和喜好信息;
    对所述居住信息、所述工作信息和所述喜好信息进行标准化处理,得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据;
    根据所述居住源数据和居住场所结果,确定出与所述用户标识关联的居住加工数据,根据所述工作源数据和工作场所结果,确定出与所述用户标识关联的工作加工数据,根据所述喜好源数据和活动场所结果,确定出与所述用户标识关联的活动加工数据;其中,所述用户活跃结果包括与所述用户标识对应的居住场所结果、工作场所结果和活动场所结果;
    将与所述用户标识关联的所述居住加工数据、所述工作加工数据和所述活动加工数据确定为与所述用户标识关联的所述活跃数据。
  5. 如权利要求4所述的区域画像图生成方法,其中,所述通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,包括:
    将所述标准方格区域地图中标记出与所述活跃数据对应的坐标;
    通过反距离权重法,对所有所述活跃数据中的所述居住加工数据进行预测,得到各单元方格的居住指标值;对所有所述活跃数据中的所述工作加工数据进行预测,得到各单元方格的工作指标值;对所有所述活跃数据中的所述活动加工数据进行预测,得到各单元方格的活动指标值;
    将所述各单元方格的所述居住指标值、所述工作指标值和所述活动指标值确定为所述活跃指标数据。
  6. 如权利要求1所述的区域画像图生成方法,其中,所述根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据,包括:
    从与所述用户标识关联的所述用户维修日志信息中的所有故障地点中识别出与所述故障地点一一对应的故障坐标;所述用户维修日志信息包括所述故障地点以及均与所述故障地点对应的故障维修记录;
    根据与所述用户标识关联的所述用户基础信息和与所述故障地点对应的所述故障维修记录,确定出与所述故障地点对应的所述故障坐标关联的故障评分值;
    通过反距离权重法,根据所述标准方格区域地图和所有所述故障评分值,预测出各所述单元方格的所述故障指标数据。
  7. 如权利要求1所述的区域画像图生成方法,其中,所述通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图,包括:
    通过所述熵值法,根据所有所述单元方格的活跃指标数据和故障指标数据,计算出与各画像指标对应的指标熵值和指标熵权;
    根据所有所述指标熵值和所述指标熵权,确定出各所述单元方格的最终画像指标值;
    将各所述单元方格的所述最终画像指标值一一映射至所述区域地图中,得到所述区域画像图。
  8. 一种区域画像图生成装置,其中,包括:
    接收模块,用于接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
    获取模块,用于自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
    识别模块,用于将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
    确定模块,用于根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
    预测模块,用于通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
    画像模块,用于通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
  9. 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其中,所述处理器执行所述计算机可读指令时实现如下步骤:
    接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
    自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
    将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
    根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
    通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
    通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
  10. 如权利要求9所述的计算机设备,其中,所述对所述区域地图网格化处理,得到标准方格区域地图,包括:
    按照预设单元网格的参数,对所述区域地图进行网格划分,得到各所述单元方格;
    根据各所述单元方格的坐标,确定与各所述单元方格对应的中心坐标;
    根据与各所述单元方格对应的中心坐标,合并所有所述单元方格,得到所述标准方格区域地图。
  11. 如权利要求9所述的计算机设备,其中,所述通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果,包括:
    通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,识别出与各所述用户标识对应的行车轨迹数据;
    通过所述车圈活跃模型对所有所述行车轨迹数据进行活跃场所识别,得到与所述用户标识对应的各场所的坐标结果;
    将与所述用户标识对应的各场所的坐标结果确定为与所述用户标识对应的所述用户活跃结果。
  12. 如权利要求11所述的计算机设备,其中,所述通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,包括:
    将所述标准方格区域地图中标记出与所述活跃数据对应的坐标;
    通过反距离权重法,对所有所述活跃数据中的所述居住加工数据进行预测,得到各单元方格的居住指标值;对所有所述活跃数据中的所述工作加工数据进行预测,得到各单元方格的工作指标值;对所有所述活跃数据中的所述活动加工数据进行预测,得到各单元方格的活动指标值;
    将所述各单元方格的所述居住指标值、所述工作指标值和所述活动指标值确定为所述 活跃指标数据。
  13. 如权利要求9所述的计算机设备,其中,所述根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据,包括:
    从与所述用户标识关联的所述用户维修日志信息中的所有故障地点中识别出与所述故障地点一一对应的故障坐标;所述用户维修日志信息包括所述故障地点以及均与所述故障地点对应的故障维修记录;
    根据与所述用户标识关联的所述用户基础信息和与所述故障地点对应的所述故障维修记录,确定出与所述故障地点对应的所述故障坐标关联的故障评分值;
    通过反距离权重法,根据所述标准方格区域地图和所有所述故障评分值,预测出各所述单元方格的所述故障指标数据。
  14. 如权利要求9所述的计算机设备,其中,所述通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图,包括:
    通过所述熵值法,根据所有所述单元方格的活跃指标数据和故障指标数据,计算出与各画像指标对应的指标熵值和指标熵权;
    根据所有所述指标熵值和所述指标熵权,确定出各所述单元方格的最终画像指标值;
    将各所述单元方格的所述最终画像指标值一一映射至所述区域地图中,得到所述区域画像图。
  15. 一个或多个存储有计算机可读指令的可读存储介质,其中,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如下步骤:
    接收画像请求,获取所述画像请求中的区域信息、时间段信息和用户信息;所述用户信息包括用户标识、用户基础信息、用户行车信息和用户维修日志信息;一个所述用户标识分别与一个所述用户基础信息、一个所述用户行车信息和一个所述用户维修日志信息关联;
    自地图数据库中获取与所述区域信息匹配的区域地图,对所述区域地图进行网格化处理,得到标准方格区域地图;
    将各与所述用户标识关联的所述用户行车信息输入车圈活跃模型中,通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果;
    根据与所述用户标识关联的所述用户基础信息和与其对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据;
    通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,同时根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据;
    通过熵值法,对所有所述单元方格的活跃指标数据和故障指标数据进行画像,得到区域画像图;所述区域画像图表征了与所述区域信息对应的区域的用户画像分布图。
  16. 如权利要求15所述的可读存储介质,其中,所述对所述区域地图网格化处理,得到标准方格区域地图,包括:
    按照预设单元网格的参数,对所述区域地图进行网格划分,得到各所述单元方格;
    根据各所述单元方格的坐标,确定与各所述单元方格对应的中心坐标;
    根据与各所述单元方格对应的中心坐标,合并所有所述单元方格,得到所述标准方格区域地图。
  17. 如权利要求15所述的可读存储介质,其中,所述通过所述车圈活跃模型对各所述用户行车信息进行行车轨迹识别,得到与各所述用户标识对应的用户活跃结果,包括:
    通过所述车圈活跃模型对与所述用户标识对应的所述用户行车信息中的GPS信令数据进行经纬度解析,识别出与各所述用户标识对应的行车轨迹数据;
    通过所述车圈活跃模型对所有所述行车轨迹数据进行活跃场所识别,得到与所述用户标识对应的各场所的坐标结果;
    将与所述用户标识对应的各场所的坐标结果确定为与所述用户标识对应的所述用户活跃结果。
  18. 如权利要求15所述的可读存储介质,其中,所述根据与所述用户标识关联的所述用户基础信息和对应的所述用户活跃结果,确定出与所述用户标识关联的活跃数据,包括:
    从与所述用户标识关联的所述用户基础信息中识别出居住信息、工作信息和喜好信息;
    对所述居住信息、所述工作信息和所述喜好信息进行标准化处理,得到与所述居住信息对应的居住源数据、与所述工作信息对应的工作源数据和与所述喜好信息对应的喜好源数据;
    根据所述居住源数据和居住场所结果,确定出与所述用户标识关联的居住加工数据,根据所述工作源数据和工作场所结果,确定出与所述用户标识关联的工作加工数据,根据所述喜好源数据和活动场所结果,确定出与所述用户标识关联的活动加工数据;其中,所述用户活跃结果包括与所述用户标识对应的居住场所结果、工作场所结果和活动场所结果;
    将与所述用户标识关联的所述居住加工数据、所述工作加工数据和所述活动加工数据确定为与所述用户标识关联的所述活跃数据。
  19. 如权利要求18所述的可读存储介质,其中,所述通过反距离权重法,根据所有与所述用户标识关联的所述活跃数据和所述标准方格区域地图,预测出所述标准方格区域地图中的各单元方格的活跃指标数据,包括:
    将所述标准方格区域地图中标记出与所述活跃数据对应的坐标;
    通过反距离权重法,对所有所述活跃数据中的所述居住加工数据进行预测,得到各单元方格的居住指标值;对所有所述活跃数据中的所述工作加工数据进行预测,得到各单元方格的工作指标值;对所有所述活跃数据中的所述活动加工数据进行预测,得到各单元方格的活动指标值;
    将所述各单元方格的所述居住指标值、所述工作指标值和所述活动指标值确定为所述活跃指标数据。
  20. 如权利要求15所述的可读存储介质,其中,所述根据所述标准方格区域地图和与各所述用户标识关联的所述用户基础信息及所述用户维修日志信息,预测出各所述单元方格的故障指标数据,包括:
    从与所述用户标识关联的所述用户维修日志信息中的所有故障地点中识别出与所述故障地点一一对应的故障坐标;所述用户维修日志信息包括所述故障地点以及均与所述故障地点对应的故障维修记录;
    根据与所述用户标识关联的所述用户基础信息和与所述故障地点对应的所述故障维修记录,确定出与所述故障地点对应的所述故障坐标关联的故障评分值;
    通过反距离权重法,根据所述标准方格区域地图和所有所述故障评分值,预测出各所述单元方格的所述故障指标数据。
PCT/CN2021/090114 2020-11-17 2021-04-27 区域画像图生成方法、装置、计算机设备及存储介质 WO2022105111A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202011288140.5A CN112417273B (zh) 2020-11-17 2020-11-17 区域画像图生成方法、装置、计算机设备及存储介质
CN202011288140.5 2020-11-17

Publications (1)

Publication Number Publication Date
WO2022105111A1 true WO2022105111A1 (zh) 2022-05-27

Family

ID=74832535

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/090114 WO2022105111A1 (zh) 2020-11-17 2021-04-27 区域画像图生成方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN112417273B (zh)
WO (1) WO2022105111A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134407A (zh) * 2022-06-27 2022-09-30 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质
CN115470872A (zh) * 2022-11-14 2022-12-13 武汉大学 一种基于车辆轨迹数据的司机画像构建方法
CN115600840A (zh) * 2022-12-07 2023-01-13 南方电网数字电网研究院有限公司(Cn) 用户群体碳排放动态画像模型构建方法、装置及设备
CN115757986A (zh) * 2022-11-23 2023-03-07 重庆大学 一种乡村生活圈感知画像的方法、装置和介质
CN117633254A (zh) * 2024-01-26 2024-03-01 武汉大学 一种基于知识图谱的地图检索用户画像构建方法和系统
CN118041687A (zh) * 2024-04-08 2024-05-14 国网浙江省电力有限公司杭州供电公司 一种基于网口封堵设备的感知安全防护系统及方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417273B (zh) * 2020-11-17 2022-04-19 平安科技(深圳)有限公司 区域画像图生成方法、装置、计算机设备及存储介质
CN113157817B (zh) * 2021-03-15 2024-05-10 平安科技(深圳)有限公司 区分驾驶员的方法、装置和计算机设备
CN113836661B (zh) * 2021-09-24 2024-02-20 北京百度网讯科技有限公司 时间预测方法、模型训练方法、相关装置及电子设备
CN114296498A (zh) * 2021-12-31 2022-04-08 中国工商银行股份有限公司 网点机房的监控系统和方法
CN115408573A (zh) * 2022-10-31 2022-11-29 北京大数据先进技术研究院 装备领域综合画像生成方法、装置、设备、介质和产品
CN116523310B (zh) * 2023-04-28 2023-11-14 中交一公局第七工程有限公司 用于城市地下管网的危险源识别系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150363508A1 (en) * 2014-06-17 2015-12-17 Naveen NANDAN Grid-based analysis of geospatial trajectories
CN109741629A (zh) * 2018-12-21 2019-05-10 平安科技(深圳)有限公司 用户画像实时构建方法、系统、计算机设备及存储介质
CN111178932A (zh) * 2019-11-26 2020-05-19 深圳壹账通智能科技有限公司 用户地理画像生成方法、装置、计算机设备和存储介质
CN111311784A (zh) * 2020-03-04 2020-06-19 深圳市物语智联科技有限公司 用户画像确定方法、装置、计算机设备及存储介质
CN112417273A (zh) * 2020-11-17 2021-02-26 平安科技(深圳)有限公司 区域画像图生成方法、装置、计算机设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2382972C (en) * 1999-08-23 2016-03-01 General Electric Company Apparatus and method for managing a fleet of mobile assets
US20130268232A1 (en) * 2012-04-10 2013-10-10 Qualcomm Incorporated Informative Display for Statistical Positioning System
CN105005700A (zh) * 2015-07-21 2015-10-28 河海大学 一种基于熵值和内外权重的沉降危害度区划方法
CN107547633B (zh) * 2017-07-27 2021-09-03 腾讯科技(深圳)有限公司 一种用户常驻点的处理方法、装置和存储介质
KR102030736B1 (ko) * 2017-11-24 2019-10-10 주식회사 리얼타임테크 다중 분산 영상 데이터 분석 장치
CN108391235B (zh) * 2018-02-13 2020-12-22 中国联合网络通信集团有限公司 一种数据分析方法及装置
CN109934634A (zh) * 2019-03-16 2019-06-25 义乌市腾飞汽车代驾服务有限公司 地图网格排名方法、装置、系统、计算机设备和存储介质
CN109947826A (zh) * 2019-03-29 2019-06-28 山东浪潮云信息技术有限公司 一种运用大数据技术构建区域画像分析模型的方法
CN110413855B (zh) * 2019-07-11 2023-02-24 南通大学 一种基于出租车下客点的区域出入口动态提取方法
CN110569321B (zh) * 2019-07-23 2023-04-11 平安科技(深圳)有限公司 基于城市地图的网格划分处理方法、装置和计算机设备
CN111832966A (zh) * 2020-07-24 2020-10-27 山东中医药大学 中医类医院区域画像构建方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150363508A1 (en) * 2014-06-17 2015-12-17 Naveen NANDAN Grid-based analysis of geospatial trajectories
CN109741629A (zh) * 2018-12-21 2019-05-10 平安科技(深圳)有限公司 用户画像实时构建方法、系统、计算机设备及存储介质
CN111178932A (zh) * 2019-11-26 2020-05-19 深圳壹账通智能科技有限公司 用户地理画像生成方法、装置、计算机设备和存储介质
CN111311784A (zh) * 2020-03-04 2020-06-19 深圳市物语智联科技有限公司 用户画像确定方法、装置、计算机设备及存储介质
CN112417273A (zh) * 2020-11-17 2021-02-26 平安科技(深圳)有限公司 区域画像图生成方法、装置、计算机设备及存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115134407A (zh) * 2022-06-27 2022-09-30 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质
CN115134407B (zh) * 2022-06-27 2024-04-26 平安银行股份有限公司 活跃区域确定方法、装置、计算机设备及存储介质
CN115470872A (zh) * 2022-11-14 2022-12-13 武汉大学 一种基于车辆轨迹数据的司机画像构建方法
CN115757986A (zh) * 2022-11-23 2023-03-07 重庆大学 一种乡村生活圈感知画像的方法、装置和介质
CN115757986B (zh) * 2022-11-23 2023-10-03 重庆大学 一种乡村生活圈感知画像的方法、装置和介质
CN115600840A (zh) * 2022-12-07 2023-01-13 南方电网数字电网研究院有限公司(Cn) 用户群体碳排放动态画像模型构建方法、装置及设备
CN117633254A (zh) * 2024-01-26 2024-03-01 武汉大学 一种基于知识图谱的地图检索用户画像构建方法和系统
CN117633254B (zh) * 2024-01-26 2024-04-05 武汉大学 一种基于知识图谱的地图检索用户画像构建方法和系统
CN118041687A (zh) * 2024-04-08 2024-05-14 国网浙江省电力有限公司杭州供电公司 一种基于网口封堵设备的感知安全防护系统及方法

Also Published As

Publication number Publication date
CN112417273B (zh) 2022-04-19
CN112417273A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
WO2022105111A1 (zh) 区域画像图生成方法、装置、计算机设备及存储介质
CN111950329A (zh) 目标检测及模型训练方法、装置、计算机设备和存储介质
CN109829020B (zh) 地点资源数据推送方法、装置、计算机设备和存储介质
CN110020144B (zh) 一种推荐模型建立方法及其设备、存储介质、服务器
EP2805323A1 (en) Automatic input signal recognition using location based language modeling
WO2021004318A1 (zh) 资源数据的处理方法、装置、计算机设备和存储介质
He et al. An adapted geographically weighted LASSO (Ada-GWL) model for predicting subway ridership
CN111639092B (zh) 一种人员流动分析方法、装置、电子设备及存储介质
WO2018188509A1 (zh) 楼盘信息处理方法、装置、计算机设备及存储介质
CN111626519A (zh) 一种航班到达时间预测方法、装置和电子设备
CN111242922A (zh) 一种蛋白质图像分类方法、装置、设备及介质
CN115605903A (zh) 用于快速组成、启动和配置具有内置审计和监测结构的可定制的第二层级转移结构的系统及其方法
CN110674208B (zh) 用于确定用户的职住地信息的方法和装置
Hanus et al. Three‐stage assessment of parcel area quality
CN112990530A (zh) 区域人口数量预测方法、装置、电子设备和存储介质
WO2024021350A1 (zh) 图像识别模型训练方法、装置、计算机设备和存储介质
CN116701734A (zh) 地址文本的处理方法、设备及计算机可读存储介质
CN116361552A (zh) 校园图书检索方法、装置、设备及可读存储介质
CN115794398A (zh) 资源分配方法、装置、电子设备及存储介质
CN116340781A (zh) 相似度确定方法、相似度预测模型训练方法及装置
CN109635057B (zh) 用电业务处理方法、装置、计算机设备和存储介质
CN115190587A (zh) Wifi位置确定方法、装置、电子设备及存储介质
CN111401055B (zh) 从金融资讯提取脉络信息的方法和装置
CN111125272B (zh) 一种区域特征获取方法、装置、计算机设备及介质
CN110852400A (zh) 分类模型的评估方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21893268

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21893268

Country of ref document: EP

Kind code of ref document: A1