WO2015139559A1 - 生成数字人的方法及系统 - Google Patents

生成数字人的方法及系统 Download PDF

Info

Publication number
WO2015139559A1
WO2015139559A1 PCT/CN2015/073658 CN2015073658W WO2015139559A1 WO 2015139559 A1 WO2015139559 A1 WO 2015139559A1 CN 2015073658 W CN2015073658 W CN 2015073658W WO 2015139559 A1 WO2015139559 A1 WO 2015139559A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
data
dimensions
module
portrait
Prior art date
Application number
PCT/CN2015/073658
Other languages
English (en)
French (fr)
Inventor
李英涛
钱莉
黄茂胜
黄康敏
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2015139559A1 publication Critical patent/WO2015139559A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Definitions

  • the present invention relates to the field of communications, and more particularly to a method and system for generating digital people in the field of communications.
  • ICT Information Communication Technology
  • Embodiments of the present invention provide a method and system for generating a digital person, which can acquire data of multiple dimensions of users from multiple data sources, mine data and generate digital people.
  • a method of generating a digital person comprising: defining a digital human model comprising a plurality of dimensions of a user portrait model; acquiring a plurality of dimensions of a plurality of data sources of a particular user Data; based on a plurality of dimensions of the user portrait model included in the digital human model, processing data of a plurality of dimensions from a plurality of data sources of a specific user, generating a user portrait corresponding to a plurality of dimensions of the specific user, the specific user
  • the user portraits of multiple dimensions constitute a digital person corresponding to a specific user.
  • acquiring data of multiple dimensions of a specific user from multiple data sources includes: acquiring multiple users from multiple data sources Dimensional data; data of a plurality of dimensions from a plurality of data sources belonging to a specific user are determined in data of a plurality of dimensions of a plurality of users from a plurality of data sources according to a affiliation relationship of the data with the user.
  • acquiring data of multiple dimensions of multiple users from multiple data sources including: using a terminal, and communicating At least one of a network element and a data collection agent acquires data of a plurality of dimensions of a plurality of users from a plurality of data sources.
  • the user portrait of the plurality of dimensions It includes at least two of the following: a user image dimension portrait, a user health dimension portrait, a user behavior habit dimension dimension, a user social mode dimension portrait, a user consumption habit dimension portrait, and a user interest hobby dimension portrait.
  • the method further includes: Data of a plurality of dimensions from a plurality of data sources of a specific user is cleaned; time and keywords corresponding to the content of the cleaned data are extracted; time and keywords are used as annotation information, and the cleaned data is marked;
  • the user portrait model of the plurality of dimensions of the specific user is processed based on the user portrait model of the plurality of dimensions included in the digital human model, and the user portraits corresponding to the plurality of dimensions of the specific user are generated, including: Based on the user portrait models of multiple dimensions included in the digital human model, the labeled data is processed to generate user portraits corresponding to multiple dimensions of a particular user.
  • the method further includes: Data cleaning of a plurality of dimensions of a plurality of data sources of a specific user; extracting time, location, and keywords corresponding to the content of the cleaned data; using time, location, and keywords as annotation information, after cleaning Data is annotated; wherein, based on a plurality of dimensions of the user portrait model included in the digital human model, data of a plurality of dimensions from a plurality of data sources of a specific user is processed to generate users corresponding to multiple dimensions of a specific user
  • the image includes: a user portrait model based on multiple dimensions included in the digital human model, and processes the labeled data to generate a corresponding image A user portrait of multiple dimensions of a user.
  • the method further includes: storing the labeled data.
  • a seventh possible implementation of the first aspect in a digital human model based The user portrait model of multiple dimensions is included, after processing data of multiple dimensions of a specific user from multiple data sources to generate a user portrait corresponding to multiple dimensions of a specific user, the method further includes: according to the client The entered query condition provides the client with a user portrait of the digital person corresponding to the query condition.
  • the method further includes: creating a user portrait model for generating a user portrait corresponding to the requirement according to the requirements of the client.
  • the digital human model is included a user portrait model of multiple dimensions, processing data of multiple dimensions from a plurality of data sources of a specific user, and generating user portraits corresponding to multiple dimensions of a specific user, including: based on the digital human model included User portrait models of dimensions, which process data of multiple dimensions of a specific user from multiple data sources by at least one of the following algorithms to generate user images corresponding to multiple dimensions of a specific user: classification algorithm, clustering algorithm , regression algorithm, enhanced learning algorithm, migration learning algorithm, deep learning algorithm and active learning algorithm.
  • a system for generating a digital person comprising: a definition module for defining a digital human model, the digital human model including a user portrait model of multiple dimensions; and an acquisition module for acquiring a specific user Data from multiple dimensions of multiple data sources; a generation module for user image models of multiple dimensions included in the digital human model defined by the definition module, from a plurality of data sources of a specific user acquired by the acquisition module
  • the data of the plurality of dimensions is processed to generate a user portrait corresponding to a plurality of dimensions of the specific user, and the user portraits of the plurality of dimensions of the specific user constitute a digital person corresponding to the specific user.
  • the acquiring module includes: an acquiring unit, configured to acquire data of multiple dimensions of multiple users from multiple data sources; And determining, according to the affiliation relationship between the data and the user, determining, in the data of the plurality of dimensions of the plurality of data sources of the plurality of users acquired by the acquiring unit, the plurality of dimensions from the plurality of data sources belonging to the specific user data.
  • the acquiring unit is specifically configured to: use at least one of a terminal, a communication network element, and a data collection agent Get data from multiple dimensions of multiple users from multiple data sources.
  • the user portrait of the plurality of dimensions It includes at least two of the following: a user image dimension portrait, a user health dimension portrait, a user behavior habit dimension dimension, a user social mode dimension portrait, a user consumption habit dimension portrait, and a user interest hobby dimension portrait.
  • the system further includes: cleaning a module, configured to perform data cleaning on data of multiple dimensions from multiple data sources of a specific user acquired by the acquiring module; and an extraction module, configured to extract time and keywords corresponding to content of the data obtained by cleaning the cleaning module;
  • the module is configured to label the data obtained by the cleaning module cleaning by using the time and the keyword as the annotation information; wherein the generating module is specifically configured to: the user portrait model based on the plurality of dimensions included in the digital human model, and the labeled image
  • the data is processed to generate a user portrait corresponding to multiple dimensions of a particular user.
  • the system further includes: cleaning a module, configured to perform data cleaning on data of multiple dimensions from multiple data sources of a specific user acquired by the acquiring module; and an extraction module, configured to extract time, location, and keywords corresponding to the content of the data obtained by the cleaning module cleaning
  • the labeling module is configured to mark the data obtained by the cleaning module cleaning by using the time, the position and the keyword as the labeling information; wherein the generating module is specifically used for: a user portrait model based on multiple dimensions included in the digital human model, The annotated data is processed to generate a user portrait corresponding to multiple dimensions of a particular user.
  • system further includes: a storage module, configured to store Label the data after the module is marked.
  • system further includes: a query module, configured to provide the client with a digital person corresponding to the query condition according to the query condition input by the client User portrait.
  • the system further includes: creating A module for creating a user portrait model for generating a user portrait corresponding to the requirement according to the requirements of the client.
  • the generating module is specifically used to : based on a plurality of dimensions of the user portrait model included in the digital human model, processing data of a plurality of dimensions from a plurality of data sources of a specific user by using at least one of the following algorithms to generate a plurality of dimensions corresponding to the specific user User portraits: classification algorithms, clustering algorithms, regression algorithms, reinforcement learning algorithms, migration learning algorithms, deep learning algorithms, and active learning algorithms.
  • a third aspect provides a system for generating a digital person, the system comprising: a receiving module, configured to receive data of a plurality of dimensions of a plurality of users from a plurality of data sources; and a data preprocessing module configured to determine the receiving module The user to which the received data belongs, and data cleaning and labeling; the data storage module is configured to store data preprocessed by the data preprocessing module; and the user identity management module is configured to manage the user in multiple data sources.
  • a method and system for generating a digital person processes data by acquiring data of multiple dimensions of users from multiple data sources, and generates a plurality of dimensions based on a digital human model. Digital person of user portrait.
  • FIG. 1 is a schematic flow chart of a method of generating a digital person according to an embodiment of the present invention.
  • FIG. 2 is a schematic flow chart of a method of generating a digital person according to another embodiment of the present invention.
  • FIG. 3 is a schematic block diagram of a system for generating a digital person in accordance with an embodiment of the present invention.
  • FIG. 4 is a schematic block diagram of an acquisition module in accordance with an embodiment of the present invention.
  • FIG. 5 is a schematic block diagram of a system for generating a digital person in accordance with another embodiment of the present invention.
  • FIG. 6 is a schematic block diagram of a system for generating a digital person in accordance with yet another embodiment of the present invention.
  • FIG. 7 is a schematic block diagram of a system for generating a digital person in accordance with yet another embodiment of the present invention.
  • FIG. 1 shows a schematic flow diagram of a method 100 of generating a digital person, which may be performed by a system that generates digital people, in accordance with an embodiment of the present invention. As shown in FIG. 1, the method 100 includes:
  • S130 Process data of multiple dimensions of a specific user based on a user portrait model of multiple dimensions included in the digital human model, and generate a user portrait corresponding to multiple dimensions of a specific user, and multiple dimensions of the specific user.
  • the user portrait constitutes a digital person corresponding to a specific user.
  • the method for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • a user portrait of a dimension is a representation of the user in the physical world in the one-dimensional feature, and is a virtual portrait in the dimension based on a deep understanding of the real data.
  • a digital person corresponding to a user in the physical world can be formed, and the digital person can characterize the user in the physical world from multiple dimensions.
  • a user portrait of a dimension is based on a user portrait model of the corresponding dimension, after mining the data Into.
  • the above dimensions may relate to images, health, behavioral habits, social modes, consumption habits, hobbies, and the like, and may include other multiple dimensions corresponding to individuals in the physical world, and embodiments of the present invention are not limited thereto.
  • the system defines a digital human model that includes user portrait models of multiple dimensions.
  • the user portrait model of a certain dimension is used to represent the features and knowledge categories of the user extracted from the relevant collected data in the dimension.
  • a digital human model containing multiple dimensional user portrait models defines a stereoscopic digital person from a number of different dimensions based on a plurality of dimensionally available data sources.
  • the determination of user portrait models of different dimensions contained in the digital human model should consider at least the following elements: the available data sources and the types of features that can be mined, the basic requirements of the system, and the newly defined update of third-party customers. The number of human characteristics needs and so on.
  • the system can set up a portrait model configuration library to maintain a user portrait model of multiple dimensions contained in the digital human model required to generate a digital person.
  • These user portrait models can be added, deleted, or modified by the system predefined and periodically updated.
  • the digital human model maintained in the platform can correspondingly define the following user portrait models: user image dimension portrait model, user health dimension portrait model, user behavior habit dimension dimension portrait model, user social model dimension portrait model, user consumption habit dimension image model And the user hobby dimension image model and the like, but the embodiment of the present invention is not limited thereto.
  • the system may determine a digital person model including different user portrait models for a user group of different attributes according to the attributes of the user.
  • the attribute of the user may be used to describe the type of user information.
  • the doctor group may also The user portrait model of the corresponding dimension corresponding to the attribute of the profession is the doctor; the teacher group may also include the user portrait model of the corresponding dimension corresponding to the attribute of the profession as the teacher, but the embodiment of the present invention is not limited thereto.
  • the system may also create or modify a corresponding user portrait model by receiving customization requirements of the client.
  • the system can include a digital human application programming interface (API) to complete the interaction of the system with third party clients.
  • API digital human application programming interface
  • the client can feed the customization request to the system through the API, so that the system can create a new one.
  • User portrait model can also To include:
  • a user portrait model for generating a user portrait corresponding to the requirement is created according to the needs of the client.
  • data of a plurality of dimensions from a plurality of data sources of a specific user is acquired.
  • the user's data can be from multiple data sources, for example, from mobile phone business platforms, real-time chat platforms such as QQ, WeChat, and travel, social platforms such as Weibo, Forum, Renren, Taobao, Dangdang, Jingdong and other shopping platforms.
  • the data may also include data related to the user generated by other users during communication, which is not limited by the embodiment of the present invention.
  • the data collected from the multiple data sources may be in multiple dimensions, such as a user's image dimension, a health dimension, a behavioral habit dimension, a social dimension, a consumption habit dimension, a hobby dimension, and the like, which are not limited by the embodiment of the present invention.
  • the system may acquire data of multiple dimensions of multiple users from multiple data sources through at least one of a terminal, a communication network element, and a data collection agent.
  • data of each user may be acquired by the terminal.
  • the terminal such as the intelligent terminal and the vehicle terminal, and various types of sensor devices on the terminal, such as GPS, motion sensor, light sensor, microphone, camera, etc.
  • information such as the environment information and the behavior of the user can be collected and acquired.
  • the trajectory data of the user in a certain field is obtained through the operation data of various application software running on the terminal and the application trajectory of the record, such as social software, motion monitoring software, health monitoring software, and the like.
  • the terminal may also record various types of self-media content generated by the user, such as photos, audio and video media, text diaries, and the like.
  • the terminal may report the related data of the user to the system for generating the digital person periodically or irregularly, or may acquire the relevant data of the user from the terminal by the system cycle of generating the digital person or irregularly.
  • data of each user may be obtained by using a communication network element.
  • a communication network element such as a Radio Network Controller (RNC) or a Home Location Register (HLR) includes a large number of related data generated by a user during communication, and a system for generating a digital person can receive the communication.
  • the network element captures related data of multiple users.
  • data of multiple users may be acquired by a data collection agent.
  • the data collection agent captures the user’s comments on the network through a web crawler. Internet traces, etc. For example, capturing log records left by users on social networks, online shopping platforms, web search platforms, web service platforms, and the like.
  • information related to the user published through various channels such as social media content of friends in the social circle of the user, information related to the user in the log, and the like are captured.
  • the data collection agent may report the captured content to the system for generating the digital person periodically or irregularly, or may acquire the relevant data of the user from the data collection agent periodically or irregularly by the system for generating the digital person.
  • the terminal can obtain user data with dense information and a relatively concentrated range, and the communication network element and the data collection agent can obtain more dispersed user data.
  • the data of the user may be obtained by other means or manners, which is not limited by the embodiment of the present invention.
  • the system can obtain data through its own device or module, and can also receive data collected by devices or modules other than the system through the interface, which is not limited by the embodiment of the present invention.
  • the method 100 acquires data of multiple dimensions of a specific user from multiple data sources, including:
  • Data of a plurality of dimensions from a plurality of data sources belonging to a specific user is determined among data of a plurality of dimensions of a plurality of users from a plurality of data sources according to a affiliation relationship of the data with the user.
  • the data belonging to the plurality of dimensions of the specific user is determined according to the attribution relationship of the user corresponding to the digital person.
  • the data source and content can be matched according to the information of the user corresponding to the digital person already existing in the system.
  • the system may store or update the data to the account of the user corresponding to the digital person, or directly mine or analyze the data, and the data will be obtained.
  • the result is stored or updated to the account of the user corresponding to the digital person.
  • the system may re-establish a user account for storing the data or the information mined by the data.
  • the system may record and maintain the correspondence between the digital person user ID and the other identity ID of the user in the physical world.
  • a table can be maintained and updated in real time, which is used to record the digital user ID and the corresponding physical world personal mobile phone number, micro signal, QQ number, Weibo account, forum account and other information.
  • the system can easily identify the data and the user's The attribution relationship can also facilitate the query of the data of each user.
  • the attribution relationship between the data and the user can also be determined according to the content of the data. For example, a piece of data is a piece of news that reports a story related to the user, and it can be determined that the piece of news is data attributed to the user.
  • the method 100 further includes:
  • S140 Perform data cleaning on data of multiple dimensions of a specific user from multiple data sources
  • the user portrait model of multiple dimensions included in the digital human model is processed to process data of multiple dimensions of a specific user, and generate user portraits corresponding to multiple dimensions of a specific user, including:
  • the labeled data is processed to generate user portraits corresponding to multiple dimensions of a particular user.
  • data of a plurality of dimensions from a plurality of data sources of the acquired specific user is data-cleaned, and the noise data is filtered.
  • the data since the data may be from multiple data sources, the data may be heterogeneous, such as structured data, semi-structured data, or unstructured data, that is, user data may be text, tables, It can also be a picture, audio or video.
  • structured data the data structures from different data sources may also be different. For example, the same is the purchase record, the data from Taobao and the data from Jingdong, the structure may be different. At this point, the data needs to be processed to make the data structure consistent, which not only facilitates data management, but also accelerates convergence in subsequent mining operations.
  • the data after data cleaning can be text, table, picture, audio or video, which is not easy to manage and analyze.
  • various types of heterogeneous cleaned data can be labeled.
  • the time and the keyword corresponding to the content included in the cleaned data may be extracted, and the time and the keyword are used as the annotation information, and the cleaned data is marked to generate a digital person or a query digital person according to the labeled information.
  • Information For example, for a piece of Zhang Guomen watching the rising flag, the labeling information can be, time: January 1, 2014; Keywords: raising the national flag.
  • the labeled information may also include location information corresponding to the content included in the data, so as to identify the location of the content contained in the data or the location of the event.
  • the information marked is also Other information indicating the characteristics of the data may be included, which is not limited by the embodiment of the present invention.
  • the labeled data is easy to manage and analyze.
  • the labeled data can be processed based on user portrait models of multiple dimensions. , generating a user portrait of multiple dimensions for a particular user.
  • the labeled data may be stored to facilitate subsequent management and production and query of digital persons.
  • Data storage management can be implemented based on Hadoop distributed platform, and considering that the data stored and managed by the platform includes various structured, semi-structured and unstructured data, its storage management involves the possibility of dynamic addition and deletion, so non- Relational databases, such as NoSQL, etc., store management data.
  • the user identifier (Identity, ID) corresponding to the digital person may be classified and stored, and the storage item may include: a user ID to which the data belongs and corresponding annotation information of the data, a data file name, The storage location of the data file, the type of the data file, and so on.
  • data of a plurality of dimensions of a specific user is processed based on a user portrait model of a plurality of dimensions included in the digital human model, and a user portrait corresponding to a plurality of dimensions of the specific user is generated, and the plurality of specific users are
  • the user portrait of the dimension constitutes a digital person corresponding to a specific user.
  • a user portrait of the corresponding dimension can be generated.
  • These user portraits may include user image dimension portraits, user health dimension portraits, user behavior habits dimension portraits, user social mode dimension portraits, user consumption habits dimension portraits, and user profiles. Interested in dimension portraits and the like, but the embodiments of the present invention are not limited thereto.
  • Processing data of multiple dimensions of a particular user can invoke a suitable data mining algorithm to mine user images that extract multiple dimensions of a particular user.
  • the data mining algorithm may include at least one of the following: a classification algorithm, a clustering algorithm, a regression algorithm, an enhanced learning algorithm, a migration learning algorithm, a deep learning algorithm, and an active learning algorithm, but the embodiment of the present invention Not limited to this.
  • the data mining algorithm can be configured in the algorithm library, and the algorithm library is updated by the system definition and periodically maintained.
  • the model includes at least the following data items: a user ID, a user preference consumer brand, a user can bear the amount of consumption, a time that the user frequently consumes, a place that the user frequently consumes, a user preference Payment method, etc.
  • the system collects data related to consumption by a user through a terminal, a communication network element, and a data collection agent. These data can be derived from the consumption records of the shopping platform, the consumption details of the credit card account, and the like.
  • Table 2 shows the user's historical consumption record, which includes the payment account, consumption time, consumption location, purchase brand, consumption amount, payment method, and so on.
  • the user corresponding to the payment account is extracted as the data of the user corresponding to the user ID, and the corresponding data mining algorithm, such as a classification algorithm, a clustering algorithm, a regression algorithm, etc., is invoked, and the user historical consumption behavior record shown in Table 2 can be analyzed and obtained.
  • the relevant statistical data of the user consumption habitual dimension portrait model generates a user consumption habitual dimension portrait of the user.
  • the users whose payment accounts are "payment account A” and “payment account 1" shown in Table 2 correspond to users whose user ID is "first digital person”.
  • the user consumption habit dimension image model data mining is performed on the data of the payment account number “payment account A” and “payment account 1”, and the user consumption habit dimension image of the user is analyzed.
  • the user consumption habit dimension dimension is: the user ID is “first digital person”, the preferred consumer brand is “sports outdoor brand”, the user can bear the consumption amount is “2000-5000 yuan”, and the user often spends the time as “Saturday or On Sundays and other rest days, the places that users often consume are “the major shopping malls in Haidian District, Beijing”.
  • the preferred payment method for users is “credit card payment”.
  • a user portrait of multiple dimensions of a particular user constitutes a digital person corresponding to a particular user.
  • a user portrait of a dimension is a representation of the user in the physical world in the one-dimensional feature, and is a virtual portrait in the dimension based on a deep understanding of the real data.
  • user portrait model defined in the digital human model user portraits of multiple dimensions can be composed into a digital person corresponding to a user in the physical world, and the digital person can characterize the user in the physical world from multiple dimensions.
  • the existing user portrait can also be updated according to the user portrait model.
  • the update may use the newly acquired data to generate a new user image to replace the original user image, or to retain the original user image, and generate a new user image, depicting the original user image and the new user image separately.
  • the characteristics of the time phase in this dimension may be used to generate a new user image to replace the original user image, or to retain the original user image, and generate a new user image, depicting the original user image and the new user image separately.
  • the method 100 may further include:
  • the client According to the query condition input by the client, the client is provided with a user portrait of the digital person corresponding to the query condition.
  • the client can implement an inquiry of a user portrait of a digital user of a certain user group through an API. For example, if the client inputs the mobile phone number of the physical world or the microblog account as the search condition, the user image of the user corresponding to the corresponding digital person can be retrieved. For another example, if the health status is “with high blood pressure” and the spending power is “higher spending power”, the user health dimension image can be queried to indicate that the user has high blood pressure, and the user consumption habit dimension image indicates the user. All users with high spending power to recommend relevant drugs or treatment devices to these users.
  • the size of the sequence numbers of the above processes does not mean the order of execution, and the order of execution of each process should be determined by its function and internal logic, and should not be taken to the embodiments of the present invention.
  • the implementation process constitutes any limitation.
  • the method for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • a method of generating a digital person according to an embodiment of the present invention is described in detail above with reference to FIGS. 1 and 2, and a system for generating a digital person according to an embodiment of the present invention will be described in detail below with reference to FIGS. 3 through 5.
  • FIG. 3 shows a schematic block diagram of a system 200 for generating digital people in accordance with an embodiment of the present invention.
  • the system 200 includes:
  • a definition module 210 for defining a digital human model, the digital human model including a user portrait model of multiple dimensions;
  • the obtaining module 220 is configured to acquire data of multiple dimensions of a specific user from multiple data sources;
  • the generating module 230 is configured to process, according to the user portrait model of the plurality of dimensions included in the digital human model defined by the definition module 210, the data of the plurality of dimensions from the plurality of data sources of the specific user acquired by the obtaining module 220, and generate Corresponding to a user portrait of a plurality of dimensions of a specific user, a user portrait of a plurality of dimensions of a specific user constitutes a digital person corresponding to a specific user.
  • the system for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • the obtaining module 220 includes:
  • the obtaining unit 221 is configured to acquire data of multiple dimensions of multiple users from multiple data sources;
  • the determining unit 222 is configured to determine, according to the affiliation relationship between the data and the user, the data from the plurality of data sources of the plurality of data sources of the plurality of users acquired by the obtaining unit 211, the plurality of data sources belonging to the specific user Data for dimensions.
  • the obtaining unit 211 is specifically configured to:
  • Data of a plurality of dimensions of a plurality of users from a plurality of data sources is acquired by at least one of a terminal, a communication network element, and a data collection agent.
  • the user portraits of the multiple dimensions include at least two of the following: a user image dimension portrait, a user health dimension portrait, a user behavior habit dimension dimension, a user social mode dimension portrait, a user consumption habit dimension image, and a user.
  • a user image dimension portrait a user health dimension portrait
  • a user behavior habit dimension dimension a user behavior habit dimension dimension
  • a user social mode dimension portrait a user consumption habit dimension image
  • a user. Hobbies dimension portrait a user image dimension portrait
  • a user health dimension portrait e.g., a user behavior habit dimension portrait
  • a user social mode dimension portrait e.g., a user social mode dimension portrait
  • a user consumption habit dimension image e.g., a user social mode dimension portrait
  • a user consumption habit dimension image e.g., a user consumption habit dimension image
  • Hobbies dimension portrait e.g., a user image dimension portrait
  • a user health dimension portrait e.g., a user behavior habit dimension
  • system 200 further includes:
  • the cleaning module 240 is configured to perform data cleaning on data of multiple dimensions from multiple data sources of a specific user acquired by the obtaining module 220;
  • the extraction module 250 is configured to extract time and keywords corresponding to the content of the data obtained by the cleaning module 240;
  • the labeling module 260 is configured to mark the data obtained by the cleaning module 240 by using the time and the keyword as the labeling information.
  • the determining unit 222 is specifically configured to:
  • User portraits of multiple dimensions included in the digital human model determined by the determination module 210 The type is processed by the data marked by the labeling module 260 to generate a user portrait corresponding to a plurality of dimensions of a specific user.
  • system 200 further includes:
  • the cleaning module 240 is configured to perform data cleaning on data of multiple dimensions from multiple data sources of a specific user acquired by the obtaining module 220;
  • the extraction module 250 is configured to extract time, location, and keywords corresponding to the content of the data obtained by the cleaning module 240;
  • the labeling module 260 is configured to mark the data obtained by the cleaning module 260 by using the time, the location, and the keyword as the labeling information.
  • the determining unit 222 is specifically configured to:
  • the data marked by the labeling module 260 is processed to generate a user portrait corresponding to a plurality of dimensions of the specific user.
  • system 200 further includes:
  • the storage module 270 is configured to store the marked data.
  • system 200 further includes:
  • the query module 280 is configured to provide the client with a user portrait of the digital person corresponding to the query condition according to the query condition input by the client.
  • system 200 further includes:
  • the creating module 290 is configured to create a user portrait model for generating a user portrait corresponding to the requirement according to the requirements of the client.
  • the generating module 230 is specifically configured to:
  • the data of the plurality of dimensions from the plurality of data sources of the specific user is processed by at least one of the following algorithms to generate a corresponding image corresponding to the specific user.
  • Classification algorithms Clustering algorithms, regression algorithms, reinforcement learning algorithms, migration learning algorithms, deep learning algorithms, and active learning algorithms.
  • a system for generating a digital person 200 may correspond to an execution subject of a method 100 of generating a digital person according to an embodiment of the present invention, and the above-described respective modules in the system 200 And other operations and/or functions, respectively, in order to implement the corresponding processes of the method in FIG. 1 and FIG. 2, for brevity, no further details are provided herein.
  • the system for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • an embodiment of the present invention further provides a system 300 for generating a digital person, the system 300 including a receiver 310, a processor 320, a memory 330, and a bus system 340, a receiver 310, a processor 320, and a memory.
  • 330 is connected by a bus system 340.
  • the memory 330 is used to store instructions, and the receiver 310 and the processor 320 are used to execute instructions stored by the memory 330.
  • the receiver 310 is configured to:
  • the processor 320 is configured to:
  • Defining a digital human model comprising a user portrait model of multiple dimensions
  • the user portrait model of the plurality of dimensions of the specific user is processed based on the user portrait models of the plurality of dimensions included in the digital human model, and the user portraits corresponding to the plurality of dimensions of the specific user are generated, and the specific users are more
  • the user portraits of the dimensions constitute a digital person corresponding to a specific user.
  • the system for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • the processor 320 may be a central processing unit (CPU), and the processor 320 may also be another general-purpose processor, a digital signal processor (DSP). , Application Specific Integrated Circuit (ASIC), Field-Programmable Gate Array (FPGA) or other programmable logic device, discrete gate or transistor logic device, discrete hardware component, etc.
  • the general purpose processor may be a microprocessor or the processor or any conventional processor or the like.
  • the memory 330 can include read only memory and random access memory and provides instructions and data to the processor 320. A portion of the memory 330 may also include a non-volatile random access memory. For example, the memory 330 can also store information of the device type.
  • the bus system 340 may include a power bus, a control bus, a status signal bus, and the like in addition to the data bus. However, for clarity of description, various buses are labeled as bus system 340 in the figure.
  • each step of the foregoing method may be completed by an integrated logic circuit of hardware in the processor 320 or an instruction in a form of software.
  • the steps of the method disclosed in the embodiments of the present invention may be directly implemented as a hardware processor, or may be performed by a combination of hardware and software modules in the processor.
  • the software module can be located in a conventional storage medium such as random access memory, flash memory, read only memory, programmable read only memory or electrically erasable programmable memory, registers, and the like.
  • the storage medium is located in the memory 330, and the processor 320 reads the information in the memory 330 and combines the hardware to perform the steps of the above method. To avoid repetition, it will not be described in detail here.
  • the receiver 310 is specifically configured to:
  • the processor 320 is specifically applicable to:
  • Data of a plurality of dimensions from a plurality of data sources belonging to a specific user is determined among data of a plurality of dimensions of a plurality of users from a plurality of data sources according to a affiliation relationship of the data with the user.
  • the receiver 310 may acquire data of multiple dimensions of multiple users from multiple data sources by using at least one of a terminal, a communication network element, and a data collection agent.
  • the user portraits of the multiple dimensions include at least two of the following: a user image dimension portrait, a user health dimension portrait, a user behavior habit dimension dimension, a user social mode dimension portrait, a user consumption habit dimension image, and a user.
  • a user image dimension portrait a user health dimension portrait
  • a user behavior habit dimension dimension a user behavior habit dimension dimension
  • a user social mode dimension portrait a user consumption habit dimension image
  • a user. Hobbies dimension portrait a user image dimension portrait
  • a user health dimension portrait e.g., a user behavior habit dimension portrait
  • a user social mode dimension portrait e.g., a user social mode dimension portrait
  • a user consumption habit dimension image e.g., a user social mode dimension portrait
  • a user consumption habit dimension image e.g., a user consumption habit dimension image
  • Hobbies dimension portrait e.g., a user image dimension portrait
  • a user health dimension portrait e.g., a user behavior habit dimension
  • the processor 320 is further configured to:
  • the time and keywords are used as annotation information, and the cleaned data is marked.
  • the processor 320 is specifically configured to:
  • the labeled data is processed to generate user portraits corresponding to multiple dimensions of a particular user.
  • the processor 320 is further configured to:
  • the time, location, and keywords are used as annotation information to label the cleaned data.
  • the processor 320 is specifically configured to:
  • the labeled data is processed to generate user portraits corresponding to multiple dimensions of a particular user.
  • the memory 330 is further configured to:
  • the processor 320 is further configured to:
  • the client According to the query condition input by the client, the client is provided with a user portrait of the digital person corresponding to the query condition.
  • the processor 320 before the processor 320 defines the digital human model, the processor 320 is further configured to:
  • a user portrait model for generating a user portrait corresponding to the requirement is created.
  • the generating, by the processor 320, the user portrait may include:
  • data of a plurality of dimensions from a plurality of data sources of a specific user are processed by at least one of the following algorithms to generate users corresponding to multiple dimensions of the specific user.
  • portrait
  • Classification algorithms Clustering algorithms, regression algorithms, reinforcement learning algorithms, migration learning algorithms, deep learning algorithms, and active learning algorithms.
  • system 300 for generating a digital person according to an embodiment of the present invention may correspond to a main body performing the method in the embodiment of the present invention, and may also correspond to the system 200 for generating a digital person according to an embodiment of the present invention, and the system 300
  • the above and other operations and/or functions of the various modules are for the purpose of implementing the corresponding processes of the method of FIG. 1 and FIG. 2, and are not described herein again for brevity.
  • the system for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. .
  • an embodiment of the present invention further provides a system 400 for generating a digital person.
  • a plurality of data sources 500 are included in the digital world 600, and the system 400 acquires data from the data source 500 to generate digital persons and interacts with the digital world 600 via an API.
  • the system 400 includes:
  • the receiving module 410 is configured to receive data of multiple dimensions of multiple users from multiple data sources;
  • the data pre-processing module 420 is configured to determine a user to which the data received by the receiving module 410 belongs. And data cleaning and labeling of the data;
  • a data storage module 430 configured to store data preprocessed by the data preprocessing module 420;
  • the user identity management module 440 is configured to manage accounts of the user in the plurality of data sources, so as to determine the relationship between the data of the plurality of users stored in the data storage module 430 and the user;
  • a user portrait model configuration library 450 for defining a user portrait model for generating a user portrait
  • An algorithm library 460 for storing and updating a plurality of algorithms for generating user portraits
  • the digital human generation maintenance module 470 is configured to process the data stored in the data storage module 430 according to an algorithm in the algorithm library 460 based on the user portrait model in the user image model configuration library 450, to generate a corresponding user image, the user
  • the portrait constitutes a digital person corresponding to the user
  • the digital human application programming interface API 480 is configured to interact with the client, so that the client queries the digital human user image generated by the digital human generation maintenance module 470 or accepts the request of the client to create a user portrait model.
  • system 400 for generating a digital human according to an embodiment of the present invention may correspond to a main body that performs the method in the embodiments of the present invention, and may also correspond to the system 200 and system 300 for generating a digital human according to an embodiment of the present invention, and
  • the above and other operations and/or functions of the various modules in system 400 are for the purpose of implementing the corresponding processes of the methods of FIGS. 1 and 2, and are not described herein again for brevity.
  • the system for generating a digital person processes data by acquiring data of a plurality of dimensions of users from a plurality of data sources, and generates a digital person including a user portrait of a plurality of dimensions based on the digital person model. And can update and maintain user information, algorithm library and user portrait model, and also interact with third-party clients.
  • the disclosed systems, devices, and The method can be implemented in other ways.
  • the device embodiments described above are merely illustrative.
  • the division of the unit is only a logical function division.
  • there may be another division manner for example, multiple units or components may be combined or Can be integrated into another system, or some features can be ignored or not executed.
  • the mutual coupling or direct coupling or communication connection shown or discussed may be an indirect coupling or communication connection through some interface, device or unit, or an electrical, mechanical or other form of connection.
  • the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the objectives of the embodiments of the present invention.
  • each functional unit in each embodiment of the present invention may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one unit.
  • the above integrated unit can be implemented in the form of hardware or in the form of a software functional unit.
  • the integrated unit if implemented in the form of a software functional unit and sold or used as a standalone product, may be stored in a computer readable storage medium.
  • the technical solution of the present invention contributes in essence or to the prior art, or all or part of the technical solution may be embodied in the form of a software product stored in a storage medium.
  • a number of instructions are included to cause a computer device (which may be a personal computer, server, or network device, etc.) to perform all or part of the steps of the methods described in various embodiments of the present invention.
  • the foregoing storage medium includes: a U disk, a mobile hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk, or an optical disk, and the like. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种生成数字人的方法及系统,该方法包括:定义数字人模型,该数字人模型包括多个维度的用户画像模型;获取特定用户的来自多个数据源的多个维度的数据;基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,特定用户的多个维度的用户画像组成了与特定用户对应的数字人。本发明实施例的生成数字人的方法及系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型生成包含多个维度的用户画像的数字人。

Description

生成数字人的方法及系统
本申请要求于2014年3月17日提交中国专利局、申请号为201410099095.7、发明名称为“生成数字人的方法及系统”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及通信领域,尤其涉及通信领域中生成数字人的方法及系统。
背景技术
随着信息通信技术(Information Communication Technology,ICT)的不断发展,物理世界中的人类活动越来越多的深入到数字世界中来。人们通过社交网络交朋友,建立朋友圈;通过微博发布对社会事件的个人观点,形成自媒体,建立个人公众形象;通过网络购物,获得各种商品与服务;通过网络银行参与管理个人资产;通过个人手机终端随时随地拍摄照片、视频,记录分享人生喜怒哀乐;人们通过穿戴式终端感测自身体征数据,监控健康。移动终端和移动互联网的进一步普及,用户在各种数据平台活动产生的数据呈现爆炸式增长,海量的数据分散在用户数字化生活的个个角落。
这些用户数据的背后,隐藏着用户的兴趣、爱好、观点、习惯、家庭、健康等各种表征物理世界个人特征的信息。但是,各种数据源产生的各个维度的用户数据是分散的,不能得到充分地挖掘。
发明内容
本发明实施例提供了一种生成数字人的方法及系统,能够获取来自多个数据源的用户的多个维度的数据,对数据进行挖掘并生成数字人。
第一方面,提供了一种生成数字人的方法,该方法包括:定义数字人模型,该数字人模型包括多个维度的用户画像模型;获取特定用户的来自多个数据源的多个维度的数据;基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,特定用户的多个维度的用户画像组成了与特定用户对应的数字人。
结合第一方面,在第一方面的第一种可能的实现方式中,获取特定用户的来自多个数据源的多个维度的数据,包括:获取多个用户的来自多个数据源的多个维度的数据;根据数据与用户的归属关系,在多个用户的来自多个数据源的多个维度的数据中,确定归属于特定用户的来自多个数据源的多个维度的数据。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,获取多个用户的来自多个数据源的多个维度的数据,包括:通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
结合第一方面或第一方面的第一种至第二种可能的实现方式中的任一种可能的实现方式,在第一方面的第三种可能的实现方式中,多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
结合第一方面或第一方面的第一种至第三种可能的实现方式中的任一种可能的实现方式,在第一方面的第四种可能的实现方式中,该方法还包括:对特定用户的来自多个数据源的多个维度的数据进行数据清洗;提取清洗后的数据的内容所对应的时间和关键词;将时间和关键词作为标注信息,对清洗后的数据进行标注;其中,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,包括:基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
结合第一方面或第一方面的第一种至第三种可能的实现方式中的任一种可能的实现方式,在第一方面的第五种可能的实现方式中,该方法还包括:对特定用户的来自多个数据源的多个维度的数据进行数据清洗;提取清洗后的数据的内容所对应的时间、位置和关键词;将时间、位置和关键词作为标注信息,对清洗后的数据进行标注;其中,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,包括:基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特 定用户的多个维度的用户画像。
结合第一方面的第四种可能的实现方式或第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,该方法还包括:存储标注后的数据。
结合第一方面或第一方面的第一种至第六种可能的实现方式中的任一种可能的实现方式,在第一方面的第七种可能的实现方式中,在基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像之后,该方法还包括:根据客户端输入的查询条件,向客户端提供与查询条件相应的数字人的用户画像。
结合第一方面或第一方面的第一种至第七种可能的实现方式中的任一种可能的实现方式,在第一方面的第八种可能的实现方式中,在定义数字人模型之前,该方法还包括:根据客户端的需求,创建与需求对应的用于生成用户画像的用户画像模型。
结合第一方面或第一方面的第一种至第八种可能的实现方式中的任一种可能的实现方式,在第一方面的第九种可能的实现方式中,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,包括:基于数字人模型所包括的多个维度的用户画像模型,通过以下至少一种算法对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像:分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法。
第二方面,提供了一种生成数字人的系统,该系统包括:定义模块,用于定义数字人模型,该数字人模型包括多个维度的用户画像模型;获取模块,用于获取特定用户的来自多个数据源的多个维度的数据;生成模块,用于基于定义模块定义的数字人模型所包括的多个维度的用户画像模型,对获取模块获取的特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,特定用户的多个维度的用户画像组成了与特定用户对应的数字人。
结合第二方面,在第二方面的第一种可能的实现方式中,获取模块包括:获取单元,用于获取多个用户的来自多个数据源的多个维度的数据;确定单 元,用于根据数据与用户的归属关系,在获取单元获取的多个用户的来自多个数据源的多个维度的数据中,确定归属于特定用户的来自多个数据源的多个维度的数据。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,该获取单元具体用于:通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
结合第二方面或第二方面的第一种至第二种可能的实现方式中的任一种可能的实现方式,在第二方面的第三种可能的实现方式中,多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
结合第二方面或第二方面的第一种至第三种可能的实现方式中的任一种可能的实现方式,在第二方面的第四种可能的实现方式中,该系统还包括:清洗模块,用于对获取模块获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;提取模块,用于提取清洗模块清洗获得的数据的内容所对应的时间和关键词;标注模块,用于将时间和关键词作为标注信息,对清洗模块清洗获得的数据进行标注;其中,生成模块具体用于:基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
结合第二方面或第二方面的第一种至第三种可能的实现方式中的任一种可能的实现方式,在第二方面的第五种可能的实现方式中,该系统还包括:清洗模块,用于对获取模块获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;提取模块,用于提取清洗模块清洗获得的数据的内容所对应的时间、位置和关键词;标注模块,用于将时间、位置和关键词作为标注信息,对清洗模块清洗获得的数据进行标注;其中,生成模块具体用于:基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
结合第二方面的第四种可能的实现方式或第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式中,该系统还包括:存储模块,用于存储标注模块标注后的数据。
结合第二方面或第二方面的第一种至第六种可能的实现方式中的任一 种可能的实现方式,在第二方面的第七种可能的实现方式中,该系统还包括:查询模块,用于根据客户端输入的查询条件,向客户端提供与查询条件相应的数字人的用户画像。
结合第二方面或第二方面的第一种至第七种可能的实现方式中的任一种可能的实现方式,在第二方面的第八种可能的实现方式中,该系统还包括:创建模块,用于根据客户端的需求,创建与需求对应的用于生成用户画像的用户画像模型。
结合第二方面或第二方面的第一种至第八种可能的实现方式中的任一种可能的实现方式,在第二方面的第九种可能的实现方式中,该生成模块具体用于:基于数字人模型所包括的多个维度的用户画像模型,通过以下至少一种算法对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像:分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法。
第三方面,提供了一种生成数字人的系统,该系统包括:接收模块,用于接收多个用户的来自多个数据源的多个维度的数据;数据预处理模块,用于确定接收模块接收的数据所归属的用户,并且对数据进行数据清洗和标注;数据存储模块,用于存储数据预处理模块预处理后的数据;用户身份管理模块,用于管理用户在多个数据源中的账户,以便于确定存储模块中存储的多个用户的数据与用户的归属关系;用户画像模型配置库,用于定义生成用户画像的用户画像模型;算法库,用于存储并更新多个用于生成用户画像的算法;数字人生成维护模块,用于基于用户画像模型配置库中的用户画像模型,根据算法库中的算法,对存储模块中存储的数据进行处理,生成对应的用户画像,用户画像组成了与用户对应的数字人;数字人应用程序编程接口API,用于与客户端进行交互,以便于客户端查询数字人生成维护模块生成数字人的用户画像或接受客户端提出的创建用户画像模型的需求。
基于上述技术方案,本发明实施例的生成数字人的方法及系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中 所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的生成数字人的方法的示意性流程图。
图2是根据本发明另一实施例的生成数字人的方法的示意性流程图。
图3是根据本发明实施例的生成数字人的系统的示意性框图。
图4是根据本发明实施例的获取模块的示意性框图。
图5是根据本发明另一实施例的生成数字人的系统的示意性框图。
图6是根据本发明又一实施例的生成数字人的系统的示意性框图。
图7是根据本发明又一实施例的生成数字人的系统的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
图1示出了根据本发明实施例的生成数字人的方法100的示意性流程图,该方法100可以由生成数字人的系统执行。如图1所示,方法100包括:
S110,定义数字人模型,该数字人模型包括多个维度的用户画像模型;
S120,获取特定用户的来自多个数据源的多个维度的数据;
S130,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,该特定用户的多个维度的用户画像组成了与特定用户对应的数字人。
因此,本发明实施例的生成数字人的方法,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
应理解,一个维度的用户画像是对用户于物理世界中在该一维度特征的展现,是在深刻理解真实数据的基础上得出的在该一维度的一个虚拟画像。多个维度的用户画像组合在一起,就可以组成一个与物理世界中的用户对应的数字人,该数字人可以从多个维度刻画物理世界中的用户的特征。一个维度的用户画像是根据对应的维度的用户画像模型,通过对数据进行挖掘后生 成的。上述维度可以涉及形象、健康、行为习惯、社交模式、消费习惯、兴趣爱好等,还可以包括与物理世界个人对应的其它多个维度,本发明实施例并不仅限于此。
在S110中,系统定义数字人模型,该数字人模型包括多个维度的用户画像模型。其中,某一维度的用户画像模型用于表征从相关采集数据中抽取出的用户在该维度的特征和知识类别。而包含多个维度用户画像模型的数字人模型,则基于可获取的多个维度的数据源,从多个不同的维度定义了一个立体的数字人。数字人模型中所包含的不同维度的用户画像模型的确定,至少应考虑如下几个要素:可使用的数据源及能够挖掘到的特征类型、系统的基本需求和第三方客户新定义的可更新的数字人特征需求等。
具体而言,系统可以设置一个画像模型配置库,以维护生成数字人所需要的数字人模型中包含的多个维度的用户画像模型。这些用户画像模型可以通过系统预定义并周期性地更新,进行增加、删除或修改。例如,平台中维护的数字人模型可以对应定义如下一些用户画像模型:用户形象维度画像模型、用户健康维度画像模型、用户行为习惯维度画像模型、用户社交模式维度画像模型、用户消费习惯维度画像模型和用户兴趣爱好维度画像模型等,但本发明实施例并不仅限于此。
应理解,系统可以根据用户的属性,为不同属性的用户群体确定包括不同用户画像模型的数字人模型。本发明实施例中,用户的属性可以用来刻画用户信息的类型。以用户职业为例,对于医生群体和教师群体,为这两个群体确定的用户画像模型,除了包含所有用户通用的用户形象维度画像模型、用户健康维度画像模型等用户画像模型,医生群体还可能包括与其职业为医生这一属性对应的相应维度的用户画像模型;教师群体还可能包括与其职业为教师这一属性对应的相应维度的用户画像模型,但本发明实施例并不限于此。
可选地,作为一个实施例,系统还可以通过接收客户端的定制需求,创建或修改对应的用户画像模型。例如,本系统可以包括数字人应用程序编程接口(Application Programming Interface,API),以完成系统与第三方客户端的交互。当客户端对某一特定维度的用户画像有需求,而当前系统的画像模型配置库中没有相对应的用户画像模型时,客户端可以通过API将定制需求反馈给系统,以便于系统创建新的用户画像模型。相应地,方法100还可 以包括:
根据客户端的需求,创建与该需求对应的用于生成用户画像的用户画像模型。
在S120中,获取特定用户的来自多个数据源的多个维度的数据。应理解,物理世界的个人在数字世界环境中各种数据平台产生的数据,经过挖掘可以综合刻画对应物理世界个人的各维度特征。用户的数据可以是来自多个数据源的,例如,可以来自手机业务平台,QQ、微信、来往等实时聊天平台,微博、论坛、人人网等社交平台,淘宝、当当、京东等购物平台,此外,数据还可以包括其他用户在通信时产生的与该用户相关的数据,本发明实施例对此不做限定。
从多种数据源收集的数据可以是多个维度的,例如用户的形象维度、健康维度、行为习惯维度、社交维度、消费习惯维度、兴趣爱好维度等,本发明实施例对此不做限定。
系统可以通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
可选地,作为一个实施例,可以通过终端获取各个用户的数据。通过智能终端、车载终端等终端以及终端上的各类传感器装置,如GPS、运动传感器、光线传感器、麦克风、摄像头等,可以采集获取用户所处的环境信息和用户的行为等信息。通过终端上运行的各类应用软件的运行数据及记录的应用轨迹,如社交软件、运动监测软件、健康监控软件等获取用户在某个领域上的轨迹数据。此外,终端还可能记录用户产生的各类自媒体内容,如照片、音视频媒体、文本日记等。终端可以周期或不定期地向生成数字人的系统上报用户的相关数据,也可以由生成数字人的系统周期或不定期地从终端获取用户的相关数据。
可选地,作为另一个实施例,可以通过通信网元获取各个用户的数据。例如,无线网络控制器(Radio Network Controller,RNC)、归属位置寄存器(Home Location Register,HLR)等通信网元上包含大量的用户在通信时产生的相关数据,生成数字人的系统可以从该通信网元捕获多个用户的相关数据。
可选地,作为另一个实施例,可以通过数据收集代理获取多个用户的数据。具体地,数据收集代理通过网络爬虫方式,捕获用户在网络上的言论、 上网痕迹等。例如捕获用户在社交网络、网购平台、网络搜索平台、网络服务平台等留下的记录日志。再如,捕获通过各种渠道发布的与该用户相关的信息,如该用户社交圈内好友的社交媒体内容、日志中与用户相关的信息等。数据收集代理可以周期或不定期地向生成数字人的系统上报所捕获的内容,也可以由生成数字人的系统周期或不定期地从数据收集代理获取用户的相关数据。
一般地,通过终端可以获取信息较密集、范围较集中的用户数据,通过通信网元、数据收集代理可以获取较分散的用户数据。此外,还可以通过其它手段或方式获取用户的数据,本发明实施例对此不作限定。
应理解,系统可以通过自身的设备或模块获取数据,也可以通过接口接收系统以外的设备或模块收集的数据,本发明实施例对此不作限定。
还应理解,通过上述方法从多种数据源获取的大量数据可以是归属于多个用户的。在该种情况下,需要确定这些数据归属于哪个用户。相应地,方法100中从多个数据源获取特定用户的多个维度的数据,包括:
获取多个用户的来自多个数据源的多个维度的数据;
根据数据与用户的归属关系,在多个用户的来自多个数据源的多个维度的数据中,确定归属于特定用户的来自多个数据源的多个维度的数据。
具体地,生成数字人的系统获取到来自多个数据源大量数据后,根据数据与数字人对应的用户的归属关系来确定归属于特定用户的多个维度的数据。例如,可以根据数据来源和内容与系统中已经存在的数字人对应的用户的信息进行匹配。当匹配到某一数据为已经存在的数字人对应的用户的相关数据时,系统可以将该数据存储或更新至该数字人对应的用户的账户下,或者直接对数据进行挖掘或分析,将得到的结果存储或更新至该数字人对应的用户的账户下。当确定某一数据不归属于当前已经存在的数字人对应的用户时,则系统可以重新建立一个用户账户,用于存储该数据或由该数据挖掘出的信息。
可选地,作为一个实施例,为了便于确定数据和数字人对应用户的归属关系,系统可以记录并维护数字人用户ID和该用户在物理世界中的其他身份ID之间的对应关系。例如,可以维护并实时更新一个表,该表用于记录数字人用户ID以及相对应的物理世界个人的手机号、微信号、QQ号、微博账号、论坛账号等信息。根据此表,系统可以很方便地辨识出数据与用户的 归属关系,也可以方便对各用户的数据的查询。例如,根据表内记录的信息,可以辨识出,微信号为“aaa111”的用户和微博账号为“ccc222”的用户对应的是同一用户,则从微信号“aaa111”获取的数据和微博账号“ccc222”获取的数据均归属于该用户。此外,还可以根据数据的内容确定数据与用户的归属关系。例如,一条数据是一则新闻,该新闻报道了与该用户相关的事迹,则可以确定该新闻是归属于该用户的数据。
可选地,作为一个实施例,如图2所示,方法100还包括:
S140,对特定用户的来自多个数据源的多个维度的数据进行数据清洗;
S150,提取清洗后的数据的内容所对应的时间和关键词;
S160,将时间和关键词作为标注信息,对该清洗后的数据进行标注;
其中,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,包括:
基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
具体而言,在S140中,对获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗,过滤噪声数据。其中,由于数据可能是来自多种数据源的,因此数据可能是异构的,例如可以是结构化的数据、半结构化的数据或非结构化的数据,即用户数据可以是文本、表格,也可以是图片、音频或视频。对于结构化的数据,来自不同数据源的数据结构也可能是不同的。例如,同样都是购买记录,来自淘宝的数据和来自京东的数据,结构可能是不同的。此时,需对这些数据进行处理,使得数据结构一致,这样不仅方便数据管理,在后续进行挖掘运算时,可以加速收敛。
经数据清洗后的数据,可以是文本、表格,也可以是图片、音频或视频,不易于管理和分析。可选地,作为一个实施例,可以对各类异构的清洗后的数据进行标注。具体地,可以提取清洗后的数据所包含的内容对应的时间和关键词,将时间和关键词作为标注信息,对该清洗后的数据进行标注,以便于根据标注信息生成数字人或查询数字人的信息。例如,对于一张在天安门观看升国旗的张片,其标注信息可以为,时间:2014年1月1日;关键词:升国旗。标注的信息还可以包括数据所包含的内容对应的位置信息,以便于辨识数据所包含的内容所在的位置或事件发生的位置。此外,标注的信息还 可以包括指示数据特征的其它信息,本发明实施例对此不作限定。
经过标注后的数据便于管理和分析,在后续基于多个维度的用户画像模型,生成特定用户的多个维度的用户画像时,可以基于多个维度的用户画像模型,对标注后的数据进行处理,生成特定用户的多个维度的用户画像。
可选地,作为一个实施例,可以存储标注后的数据,以方便后续管理及数字人的生产和查询。数据存储管理可以基于Hadoop分布式平台来实现,并且考虑到平台存储和管理的数据包括各种结构化、半结构化以及非结构化数据,其存储管理涉及动态增删的可能性,因此可采用非关系型数据库,例如NoSQL等来存储管理数据。具体地,如表1所示,可以按照数字人对应的用户标识(Identity,ID)进行分类存储和管理,存储项可以包括:数据所归属的用户ID和数据相应的标注信息、数据文件名称、数据文件的存储位置链接和数据文件的类型等。
表1
Figure PCTCN2015073658-appb-000001
在S130中,基于数字人模型所包括的多个维度的用户画像模型,对特定用户的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,该特定用户的多个维度的用户画像组成了与特定用户对应的数字人。基于上文中提及的多个维度的用户画像模型,可以生成相对应维度的用户画像。这些用户画像可以包括用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴 趣爱好维度画像等,但本发明实施例并不仅限于此。对特定用户的多个维度的数据进行处理可以调用合适的数据挖掘算法,挖掘提取出特定用户的多个维度的用户画像。可选地,作为一个实施例,数据挖掘算法可以包括以下至少一种:分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法,但本发明实施例并不仅限于此。数据挖掘算法可以配置在算法库中,由系统定义并周期性维护更新该算法库。
下面以基于用户消费习惯维度画像模型生成用户消费习惯维度画像为例来进行说明。例如,在一个用户消费习惯维度画像模型的示例中,该模型至少包括如下数据项:用户ID,用户偏好消费品牌,用户可承受消费金额,用户经常消费的时间、用户经常消费的地点,用户偏好的支付方式等。
系统通过终端、通信网元和数据收集代理等收集了某用户消费相关的数据。这些数据可以来源于购物平台的消费记录、信用卡账户的消费明细记录等。表2所示为用户的历史消费记录,其内容包括支付账号、消费时间、消费地点、购买品牌、消费金额、支付方式等。提取支付账号对应的用户为用户ID对应的用户的数据,调用相应的数据挖掘算法,如分类算法、聚类算法、回归算法等,从表2所示的用户历史消费行为记录中,可以分析获得用户消费习惯维度画像模型的相关统计数据,生成该用户的用户消费习惯维度画像。
例如,表2中所示的支付账号为“支付账号A”和“支付账号1”的用户,均与用户ID为“第一数字人”的用户对应。可以根据用户消费习惯维度画像模型,通过对上述支付账号为“支付账号A”和“支付账号1”的数据进行数据挖掘,分析得到该用户的用户消费习惯维度画像。用户消费习惯维度画像为:用户ID为“第一数字人”,偏好消费品牌为“运动户外品牌”,用户可承受消费金额为“2000-5000元”,用户经常消费的时间为“周六或周日等休息日”、用户经常消费的地点为“北京市海淀区各大商场”,用户偏好的支付方式为“信用卡支付”。
表2
支付账号 购买品牌 消费金额 消费时间 消费地点 支付方式
支付账号A 耐克 1299 20140104 北京中关村 信用卡
支付账号1 哥伦比亚 3499 20140105 北京五道口 信用卡
支付账号A 阿迪达斯 1399 20140119 北京中关村 信用卡
支付账号1 北面 2499 20140125 北京五道口 信用卡
特定用户的多个维度的用户画像就组成了与特定用户对应的数字人。一个维度的用户画像是对用户于物理世界中在该一维度特征的展现,是在深刻理解真实数据的基础上得出的在该一维度的一个虚拟画像。可以根据数字人模型中定义的用户画像模型,将多个维度的用户画像组成一个与物理世界中的用户对应的数字人,该数字人可以从多个维度刻画物理世界中的用户的特征。在系统新获取到与该特定用户相关的数据时,还可以根据用户画像模型对已有的用户画像进行更新。应理解,更新可以用新获取的数据生成新的用户画像对原用户画像进行替换,也可以保留原用户画像,并生成新的用户画像,以原用户画像和新的用户画像分别刻画用户在不同的时间阶段在该维度的特征。
可选地,作为一个实施例,在生产数字人之后,方法100还可以包括:
根据客户端输入的查询条件,向客户端提供与查询条件相应的数字人的用户画像。
具体而言,客户端可以通过API实现对一定用户群体的数字人的用户画像的查询。例如,客户端输入物理世界个人的手机号或微博账号作为检索条件,则可以检索出相应的数字人对应的用户的用户画像。再如,输入健康状况为“患有高血压”,并且消费能力为“较高的消费能力”,可以查询出用户健康维度画像表明该用户患有高血压,并且用户消费习惯维度画像表明该用户具有较高的消费能力的所有用户,从而向这些用户推荐相关药物或治疗设备。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
因此,本发明实施例的生成数字人的方法,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
上文中结合图1和图2,详细描述了根据本发明实施例的生成数字人的方法,下面将结合图3至图5,详细描述根据本发明实施例的生成数字人的系统。
图3示出了根据本发明实施例的生成数字人的系统200的示意性框图。 如图3所示,该系统200包括:
定义模块210,用于定义数字人模型,数字人模型包括多个维度的用户画像模型;
获取模块220,用于获取特定用户的来自多个数据源的多个维度的数据;
生成模块230,用于基于定义模块210定义的数字人模型所包括的多个维度的用户画像模型,对获取模块220获取的特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,特定用户的多个维度的用户画像组成了与特定用户对应的数字人。
因此,本发明实施例的生成数字人的系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
可选地,作为一个实施例,如图4所示,获取模块220包括:
获取单元221,用于获取多个用户的来自多个数据源的多个维度的数据;
确定单元222,用于根据数据与用户的归属关系,在获取单元211获取的多个用户的来自多个数据源的多个维度的数据中,确定归属于特定用户的来自多个数据源的多个维度的数据。
可选地,作为一个实施例,获取单元211具体用于:
通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
可选地,作为一个实施例,多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
可选地,作为一个实施例,如图5所示,系统200还包括:
清洗模块240,用于对获取模块220获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;
提取模块250,用于提取清洗模块240清洗获得的数据的内容所对应的时间和关键词;
标注模块260,用于将时间和关键词作为标注信息,对清洗模块240清洗获得的数据进行标注。
其中,确定单元222具体用于:
基于确定模块210确定的数字人模型所包括的多个维度的用户画像模 型,对经过标注模块260标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
可选地,作为一个实施例,如图5所示,系统200还包括:
清洗模块240,用于对获取模块220获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;
提取模块250,用于提取清洗模块240清洗获得的数据的内容所对应的时间、位置和关键词;
标注模块260,用于将时间、位置和关键词作为标注信息,对清洗模块260清洗获得的数据进行标注。
其中,确定单元222具体用于:
基于确定模块210确定的数字人模型所包括的多个维度的用户画像模型,对经过标注模块260标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
可选地,作为一个实施例,如图5所示,系统200还包括:
存储模块270,用于存储标注后的数据。
可选地,作为一个实施例,如图5所示,系统200还包括:
查询模块280,用于根据客户端输入的查询条件,向客户端提供与查询条件相应的数字人的用户画像。
可选地,作为一个实施例,如图5所示,系统200还包括:
创建模块290,用于根据客户端的需求,创建与需求对应的用于生成用户画像的用户画像模型。
可选地,作为一个实施例,生成模块230具体用于:
基于确定模块210确定的数字人模型所包括的多个维度的用户画像模型,通过以下至少一种算法对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像:
分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法。
应理解,在本发明实施例中,根据本发明实施例的生成数字人的系统200可对应于根据本发明实施例的生成数字人的方法100的执行主体,并且系统200中的各个模块的上述和其它操作和/或功能分别为了实现图1和图2中的方法的相应流程,为了简洁,在此不再赘述。
因此,本发明实施例的生成数字人的系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
如图6所示,本发明实施例还提供了一种生成数字人的系统300,该系统300包括接收器310、处理器320、存储器330和总线系统340,接收器310、处理器320和存储器330通过总线系统340相连。存储器330用于存储指令,接收器310和处理器320用于执行存储器330存储的指令。其中,接收器310用于:
获取特定用户的来自多个数据源的多个维度的数据。
处理器320用于:
定义数字人模型,该数字人模型包括多个维度的用户画像模型;
基于数字人模型所包括的多个维度的用户画像模型,对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像,特定用户的多个维度的用户画像组成了与特定用户对应的数字人。
因此,本发明实施例的生成数字人的系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
应理解,在本发明实施例中,该处理器320可以是中央处理单元(Central Processing Unit,CPU),该处理器320还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器330可以包括只读存储器和随机存取存储器,并向处理器320提供指令和数据。存储器330的一部分还可以包括非易失性随机存取存储器。例如,存储器330还可以存储设备类型的信息。
该总线系统340除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统340。
在实现过程中,上述方法的各步骤可以通过处理器320中的硬件的集成逻辑电路或者软件形式的指令完成。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器330,处理器320读取存储器330中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
可选地,作为一个实施例,接收器310具体可用于:
获取多个用户的来自多个数据源的多个维度的数据;
处理器320具体可用于:
根据数据与用户的归属关系,在多个用户的来自多个数据源的多个维度的数据中,确定归属于特定用户的来自多个数据源的多个维度的数据。
可选地,作为一个实施例,接收器310可以通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
可选地,作为一个实施例,多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
可选地,作为一个实施例,处理器320还可用于:
对接收器310获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;
提取清洗后的数据的内容所对应的时间和关键词;
将时间和关键词作为标注信息,对清洗后的数据进行标注。
其中,处理器320具体还用于:
基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
可选地,作为一个实施例,处理器320还可用于:
对接收器310获取的特定用户的来自多个数据源的多个维度的数据进行数据清洗;
提取清洗后的数据的内容所对应的时间、位置和关键词;
将时间、位置和关键词作为标注信息,对清洗后的数据进行标注。
其中,处理器320具体还用于:
基于数字人模型所包括的多个维度的用户画像模型,对标注后的数据进行处理,生成对应于特定用户的多个维度的用户画像。
可选地,作为一个实施例,存储器330还可用于:
存储标注后的数据。
可选地,作为一个实施例,在处理器320生产数字人之后,处理器320还可用于:
根据客户端输入的查询条件,向客户端提供与查询条件相应的数字人的用户画像。
可选地,作为一个实施例,在处理器320定义数字人模型之前,处理器320还可用于:
根据客户端的需求,创建与需求对应的用于生成用户画像的用户画像模型。
可选地,作为一个实施例,处理器320生成用户画像具体可以包括:
基于数字人模型所包括的多个维度的用户画像模型,通过以下至少一种算法对特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于特定用户的多个维度的用户画像:
分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法。
应理解,根据本发明实施例的生成数字人的系统300可对应于执行本发明实施例中的方法的主体,还可以对应于根据本发明实施例的生成数字人的系统200,并且系统300中的各个模块的上述和其它操作和/或功能是为了实现图1和图2的方法的相应流程,为了简洁,在此不再赘述。
因此,本发明实施例的生成数字人的系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人。
如图7所示,本发明实施例还提供了一种生成数字人的系统400。在本发明实施例中,数字世界600中包括多个数据源500,系统400从数据源500获取数据生成数字人,并通过API与数字世界600交互。该系统400包括:
接收模块410,用于接收来自多个数据源的多个用户的多个维度的数据;
数据预处理模块420,用于确定接收模块410接收的数据所归属的用户, 并且对数据进行数据清洗和标注;
数据存储模块430,用于存储数据预处理模块420预处理后的数据;
用户身份管理模块440,用于管理用户在多个数据源中的账户,以便于确定数据存储模块430中存储的多个用户的数据与用户的归属关系;
用户画像模型配置库450,用于定义生成用户画像的用户画像模型;
算法库460,用于存储并更新多个用于生成用户画像的算法;
数字人生成维护模块470,用于基于用户画像模型配置库450中的用户画像模型,根据算法库460中的算法,对数据存储模块430中存储的数据进行处理,生成对应的用户画像,该用户画像组成了与用户对应的数字人;
数字人应用程序编程接口API 480,用于与客户端进行交互,以便于客户端查询数字人生成维护模块470生成的数字人的用户画像或接受所述客户端提出的创建用户画像模型的需求。
应理解,根据本发明实施例的生成数字人的系统400可对应于执行本发明实施例中的方法的主体,还可以对应于根据本发明实施例的生成数字人的系统200和系统300,并且系统400中的各个模块的上述和其它操作和/或功能是为了实现图1和图2的方法的相应流程,为了简洁,在此不再赘述。
因此,本发明实施例的生成数字人的系统,通过获取来自多个数据源的用户的多个维度的数据,对数据进行处理,基于数字人模型,生成包含多个维度的用户画像的数字人,并且可以进行用户信息、算法库和用户画像模型的更新和维护,还可与第三方客户端进行交互。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (21)

  1. 一种生成数字人的方法,其特征在于,包括:
    定义数字人模型,所述数字人模型包括多个维度的用户画像模型;
    获取特定用户的来自多个数据源的多个维度的数据;
    基于所述数字人模型所包括的所述多个维度的用户画像模型,对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像,所述特定用户的多个维度的用户画像组成了与所述特定用户对应的数字人。
  2. 根据权利要求1所述的方法,其特征在于,所述获取特定用户的来自多个数据源的多个维度的数据,包括:
    获取多个用户的来自多个数据源的多个维度的数据;
    根据数据与用户的归属关系,在所述多个用户的来自多个数据源的多个维度的数据中,确定归属于所述特定用户的来自多个数据源的多个维度的数据。
  3. 根据权利要求2所述的方法,其特征在于,所述获取多个用户的来自多个数据源的多个维度的数据,包括:
    通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
  4. 根据权利要求1至3中任一项所述的方法,其特征在于,所述多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
  5. 根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
    对所述特定用户的来自多个数据源的多个维度的数据进行数据清洗;
    提取清洗后的数据的内容所对应的时间和关键词;
    将所述时间和关键词作为标注信息,对所述清洗后的数据进行标注;
    其中,所述基于所述数字人模型所包括的所述多个维度的用户画像模型,对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像,包括:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,对标注后 的数据进行处理,生成对应于所述特定用户的多个维度的用户画像。
  6. 根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
    对所述特定用户的来自多个数据源的多个维度的数据进行数据清洗;
    提取清洗后的数据的内容所对应的时间、位置和关键词;
    将所述时间、位置和关键词作为标注信息,对所述清洗后的数据进行标注;
    其中,所述基于所述数字人模型所包括的所述多个维度的用户画像模型,对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像,包括:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,对标注后的数据进行处理,生成对应于所述特定用户的多个维度的用户画像。
  7. 根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
    存储所述标注后的数据。
  8. 根据权利要求1至7中任一项所述的方法,其特征在于,在所述基于所述数字人模型所包括的所述多个维度的用户画像模型,对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像之后,所述方法还包括:
    根据客户端输入的查询条件,向所述客户端提供与查询条件相应的数字人的用户画像。
  9. 根据权利要求1至8中任一项所述的方法,其特征在于,在所述定义数字人模型之前,所述方法还包括:
    根据客户端的需求,创建与所述需求对应的用于生成用户画像的用户画像模型。
  10. 根据权利要求1至9中任一项所述的方法,其特征在于,所述基于所述数字人模型所包括的所述多个维度的用户画像模型,对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像,包括:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,通过以下至少一种算法对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像:
    分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度学习算法和主动学习算法。
  11. 一种生成数字人的系统,其特征在于,包括:
    定义模块,用于定义数字人模型,所述数字人模型包括多个维度的用户画像模型;
    获取模块,用于获取特定用户的来自多个数据源的多个维度的数据;
    生成模块,用于基于所述定义模块定义的所述数字人模型所包括的所述多个维度的用户画像模型,对所述获取模块获取的所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像,所述特定用户的多个维度的用户画像组成了与所述特定用户对应的数字人。
  12. 根据权利要求11所述的系统,其特征在于,所述获取模块包括:
    获取单元,用于获取多个用户的来自多个数据源的多个维度的数据;
    确定单元,用于根据数据与用户的归属关系,在所述获取单元获取的所述多个用户的来自多个数据源的多个维度的数据中,确定归属于所述特定用户的来自多个数据源的多个维度的数据。
  13. 根据权利要求12所述的系统,其特征在于,所述获取单元具体用于:
    通过终端、通信网元和数据收集代理中的至少一种设备,获取多个用户的来自多个数据源的多个维度的数据。
  14. 根据权利要求11至13中任一项所述的系统,其特征在于,所述多个维度的用户画像包括以下至少两种:用户形象维度画像、用户健康维度画像、用户行为习惯维度画像、用户社交模式维度画像、用户消费习惯维度画像和用户兴趣爱好维度画像。
  15. 根据权利要求11至14中任一项所述的系统,其特征在于,所述系统还包括:
    清洗模块,用于对所述获取模块获取的所述特定用户的来自多个数据源的多个维度的数据进行数据清洗;
    提取模块,用于提取所述清洗模块清洗获得的数据的内容所对应的时间和关键词;
    标注模块,用于将所述时间和关键词作为标注信息,对所述清洗模块清 洗获得的数据进行标注;
    其中,所述生成模块具体用于:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,对标注后的数据进行处理,生成对应于所述特定用户的多个维度的用户画像。
  16. 根据权利要求11至14中任一项所述的系统,其特征在于,所述系统还包括:
    清洗模块,用于对所述获取模块获取的所述特定用户的来自多个数据源的多个维度的数据进行数据清洗;
    提取模块,用于提取所述清洗模块清洗获得的数据的内容所对应的时间、位置和关键词;
    标注模块,用于将所述时间、位置和关键词作为标注信息,对所述清洗模块清洗获得的数据进行标注;
    其中,所述生成模块具体用于:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,对标注后的数据进行处理,生成对应于所述特定用户的多个维度的用户画像。
  17. 根据权利要求15或16所述的系统,其特征在于,所述系统还包括:
    存储模块,用于存储所述标注模块标注后的数据。
  18. 根据权利要求11至17中任一项所述的系统,其特征在于,所述系统还包括:
    查询模块,用于根据客户端输入的查询条件,向所述客户端提供与查询条件相应的数字人的用户画像。
  19. 根据权利要求11至18中任一项所述的系统,其特征在于,所述系统还包括:
    创建模块,用于根据客户端的需求,创建与所述需求对应的用于生成用户画像的用户画像模型。
  20. 根据权利要求11至19中任一项所述的系统,其特征在于,所述生成模块具体用于:
    基于所述数字人模型所包括的所述多个维度的用户画像模型,通过以下至少一种算法对所述特定用户的来自多个数据源的多个维度的数据进行处理,生成对应于所述特定用户的多个维度的用户画像:
    分类算法、聚类算法、回归算法、增强学习算法、迁移学习算法、深度 学习算法和主动学习算法。
  21. 一种生成数字人的系统,其特征在于,包括:
    接收模块,用于接收多个用户的来自多个数据源的多个维度的数据;
    数据预处理模块,用于确定所述接收模块接收的数据所归属的用户,并且对所述数据进行数据清洗和标注;
    数据存储模块,用于存储所述数据预处理模块预处理后的数据;
    用户身份管理模块,用于管理所述用户在所述多个数据源中的账户,以便于确定所述存储模块中存储的多个用户的数据与用户的归属关系;
    用户画像模型配置库,用于定义生成用户画像的用户画像模型;
    算法库,用于存储并更新多个用于生成用户画像的算法;
    数字人生成维护模块,用于基于所述用户画像模型配置库中的用户画像模型,根据所述算法库中的算法,对所述存储模块中存储的数据进行处理,生成对应的用户画像,所述用户画像组成了与用户对应的数字人;
    数字人应用程序编程接口API,用于与客户端进行交互,以便于客户端查询所述数字人生成维护模块生成数字人的用户画像或接受所述客户端提出的创建用户画像模型的需求。
PCT/CN2015/073658 2014-03-17 2015-03-04 生成数字人的方法及系统 WO2015139559A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410099095.7A CN104933049B (zh) 2014-03-17 2014-03-17 生成数字人的方法及系统
CN201410099095.7 2014-03-17

Publications (1)

Publication Number Publication Date
WO2015139559A1 true WO2015139559A1 (zh) 2015-09-24

Family

ID=54069218

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2015/073658 WO2015139559A1 (zh) 2014-03-17 2015-03-04 生成数字人的方法及系统

Country Status (3)

Country Link
US (1) US10607133B2 (zh)
CN (1) CN104933049B (zh)
WO (1) WO2015139559A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656687A (zh) * 2021-07-27 2021-11-16 华南师范大学 基于教研数据的教师画像构建方法

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404629B (zh) 2014-09-12 2020-10-27 华为技术有限公司 确定地图界面的方法和装置
CN106815787A (zh) * 2015-11-27 2017-06-09 大唐软件技术股份有限公司 一种基于智慧社区的居民信息画像方法和装置
CN106874266A (zh) * 2015-12-10 2017-06-20 中国电信股份有限公司 用户画像方法和用于用户画像的装置
CN105589956B (zh) * 2015-12-21 2018-11-27 东软集团股份有限公司 一种用户画像的方法及装置
CN105787074A (zh) * 2016-03-01 2016-07-20 深圳市百米生活股份有限公司 基于用户线下lbs轨迹结合线上浏览行为的大数据系统
EP3454448A4 (en) 2016-06-01 2019-08-07 Huawei Technologies Co., Ltd. CHARGING METHOD AND TERMINAL
CN106095924A (zh) * 2016-06-12 2016-11-09 北京万物语联技术有限公司 个人数据集系统和个人数据集生成与应用方法
WO2018000281A1 (zh) * 2016-06-29 2018-01-04 深圳狗尾草智能科技有限公司 一种基于深度神经网络的用户画像表示学习系统及方法
WO2018040068A1 (zh) 2016-09-02 2018-03-08 浙江核新同花顺网络信息股份有限公司 基于知识图谱的语意分析系统及方法
US10432671B2 (en) 2016-09-16 2019-10-01 Oracle International Corporation Dynamic policy injection and access visualization for threat detection
CN106708983A (zh) * 2016-12-09 2017-05-24 竹间智能科技(上海)有限公司 基于对话交互信息构建用户画像的系统及方法
CN106547925A (zh) * 2016-12-13 2017-03-29 竹间智能科技(上海)有限公司 调整对话系统响应性格的方法及装置
CN106874093B (zh) * 2017-02-14 2021-09-14 阿里巴巴(中国)有限公司 基于用户画像计算目标人群的方法、计算引擎及计算设备
CN106933991A (zh) * 2017-02-24 2017-07-07 陈晶 一种面向智能终端的深度分析与用户画像系统及方法
CN108572966A (zh) * 2017-03-09 2018-09-25 神州数码系统集成服务有限公司 一种创建个人画像的方法及装置
US10721239B2 (en) 2017-03-31 2020-07-21 Oracle International Corporation Mechanisms for anomaly detection and access management
US20200042597A1 (en) * 2017-04-27 2020-02-06 Microsoft Technology Licensing, Llc Generating question-answer pairs for automated chatting
EP3627806A4 (en) * 2017-06-16 2020-05-13 Huawei Technologies Co., Ltd. USER PORTRAIT GENERATION METHOD, AND TERMINAL
CN107239579A (zh) * 2017-07-03 2017-10-10 王小平 人体智能塑模方法以及系统
CN107392656A (zh) * 2017-07-07 2017-11-24 芜湖恒天易开软件科技股份有限公司 租车行业用户画像的制定和营销效果跟踪方法
CN107770241A (zh) * 2017-08-22 2018-03-06 北京五八信息技术有限公司 推荐信息的获取方法和装置
CN107316644A (zh) * 2017-08-22 2017-11-03 北京百度网讯科技有限公司 用于信息交互的方法及装置
CN107609112A (zh) * 2017-09-13 2018-01-19 陈其亮 人际管理方法及服务器
CN107992903A (zh) * 2017-09-20 2018-05-04 翔创科技(北京)有限公司 牲畜身份识别方法、装置、存储介质和电子设备
CN107729560A (zh) * 2017-11-08 2018-02-23 北京奇虎科技有限公司 基于大数据的用户画像构造方法、装置及计算设备
CN107862053A (zh) * 2017-11-08 2018-03-30 北京奇虎科技有限公司 基于用户关系的用户画像构造方法、装置及计算设备
CN108021670A (zh) * 2017-12-06 2018-05-11 中国南方航空股份有限公司 多源异构数据融合系统及方法
CN109146539A (zh) * 2018-06-28 2019-01-04 深圳市彬讯科技有限公司 用户画像的更新方法及装置
CN109063059B (zh) * 2018-07-20 2021-07-27 腾讯科技(深圳)有限公司 行为日志处理方法、装置及电子设备
WO2020070758A2 (en) * 2018-10-03 2020-04-09 Tata Consultancy Services Limited Systems and methods for simulation of humans by human twin
CN109460511B (zh) * 2018-10-25 2021-10-26 百度在线网络技术(北京)有限公司 一种获取用户画像的方法、装置、电子设备及存储介质
CN111292114B (zh) * 2018-12-10 2023-06-23 百度在线网络技术(北京)有限公司 用于生成标签的方法和装置
CN109711874A (zh) * 2018-12-17 2019-05-03 平安科技(深圳)有限公司 用户画像生成方法、装置、计算机设备和存储介质
CN109684330A (zh) * 2018-12-17 2019-04-26 深圳市华云中盛科技有限公司 用户画像库构建方法、装置、计算机设备及存储介质
CN111382266B (zh) * 2018-12-28 2024-09-13 沈阳美行科技股份有限公司 一种用户画像的生成方法、装置和设备
CN112001739A (zh) * 2019-05-27 2020-11-27 广东小天才科技有限公司 一种生成用户学习画像的方法和系统
WO2020248131A1 (zh) * 2019-06-11 2020-12-17 深圳市欢太科技有限公司 用户画像构建方法及相关产品
CN112115346B (zh) * 2019-06-21 2023-08-18 百度在线网络技术(北京)有限公司 线索数据处理方法及装置
KR20210012730A (ko) 2019-07-26 2021-02-03 삼성전자주식회사 인공지능 모델의 학습 방법 및 전자 장치
CN110765170A (zh) * 2019-09-26 2020-02-07 维沃移动通信有限公司 一种用户画像的生成方法及可穿戴设备
CN110705967A (zh) * 2019-10-11 2020-01-17 浪潮云信息技术有限公司 一种协查协办智能运行系统及方法
CN111046263A (zh) * 2019-11-22 2020-04-21 广东机电职业技术学院 一种学生学习兴趣画像生成系统、方法、装置及存储介质
US11544886B2 (en) 2019-12-17 2023-01-03 Samsung Electronics Co., Ltd. Generating digital avatar
CN111210201B (zh) * 2020-01-02 2021-02-26 平安科技(深圳)有限公司 职业标签建立方法、装置、电子设备及存储介质
CN113469363A (zh) * 2020-03-31 2021-10-01 日本电气株式会社 用于信息处理的方法、装置、设备和存储介质
CN111611997B (zh) * 2020-04-30 2023-04-18 青岛联合创智科技有限公司 一种基于人体动作迁移的卡通定制形象运动视频生成方法
CN112839184B (zh) * 2020-12-31 2022-02-01 深圳追一科技有限公司 图像处理方法、装置、电子设备及存储介质
CN112906546A (zh) * 2021-02-09 2021-06-04 中国工商银行股份有限公司 虚拟数字人外形、音效以及服务模型的个性化生成方法
CN112598090B (zh) * 2021-03-08 2021-05-18 北京冠新医卫软件科技有限公司 健康画像的方法、装置、设备和系统
CN113726839B (zh) * 2021-06-17 2023-05-26 武汉理工数字传播工程有限公司 一种虚拟资源发送方法、装置、设备及存储介质
CN114153516B (zh) * 2021-10-18 2022-12-09 深圳追一科技有限公司 数字人显示面板配置方法、装置、电子设备及存储介质
CN115082602B (zh) * 2022-06-15 2023-06-09 北京百度网讯科技有限公司 生成数字人的方法、模型的训练方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901277A (zh) * 2010-08-25 2010-12-01 华中科技大学 一种基于用户情景的动态本体建模方法及系统
US20120204257A1 (en) * 2006-04-10 2012-08-09 International Business Machines Corporation Detecting fraud using touchscreen interaction behavior
CN103389981A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 网络标签自动识别方法及其系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8554876B2 (en) 2004-01-23 2013-10-08 Hewlett-Packard Development Company, L.P. User profile service
US20090011319A1 (en) * 2005-04-27 2009-01-08 Equos Research Co., Ltd. Electrode and Membrane Electrode Assembly of Fuel Cell
US20090113319A1 (en) * 2007-10-30 2009-04-30 Dawson Christopher J Developing user profiles in virtual worlds
US8694899B2 (en) * 2010-06-01 2014-04-08 Apple Inc. Avatars reflecting user states
US20130185285A1 (en) * 2011-07-22 2013-07-18 Qualcomm Incorporated Method and apparatus for multiple personality support and dynamic personality selection
CN103116588B (zh) 2011-11-17 2017-07-04 深圳市世纪光速信息技术有限公司 一种个性化推荐方法及系统
CN102497404B (zh) 2011-12-02 2014-05-21 曙光信息产业(北京)有限公司 一种基于云环境的存储备份的方法
JP5845200B2 (ja) 2012-06-25 2016-01-20 株式会社コナミデジタルエンタテインメント メッセージ閲覧システム、サーバ、端末装置、制御方法およびプログラム
US10102307B2 (en) * 2013-03-15 2018-10-16 Oath Inc. Method and system for multi-phase ranking for content personalization
CN103399883B (zh) * 2013-07-19 2017-02-08 百度在线网络技术(北京)有限公司 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN103393403B (zh) 2013-07-22 2016-09-14 陕西数字人信息科技有限公司 数字人体结构剖析方法和数字人体剖析及病理分析方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120204257A1 (en) * 2006-04-10 2012-08-09 International Business Machines Corporation Detecting fraud using touchscreen interaction behavior
CN101901277A (zh) * 2010-08-25 2010-12-01 华中科技大学 一种基于用户情景的动态本体建模方法及系统
CN103389981A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 网络标签自动识别方法及其系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113656687A (zh) * 2021-07-27 2021-11-16 华南师范大学 基于教研数据的教师画像构建方法
CN113656687B (zh) * 2021-07-27 2022-12-20 华南师范大学 基于教研数据的教师画像构建方法

Also Published As

Publication number Publication date
US20150262066A1 (en) 2015-09-17
CN104933049B (zh) 2019-02-19
CN104933049A (zh) 2015-09-23
US10607133B2 (en) 2020-03-31

Similar Documents

Publication Publication Date Title
WO2015139559A1 (zh) 生成数字人的方法及系统
US10057349B2 (en) Data stream consolidation in a social networking system for near real-time analysis
CN106357517B (zh) 定向标签生成方法及装置
US11244294B2 (en) Data information transaction method and system
CN110402450B (zh) 提供与内部空间相关联的增强现实效果和三维地图构建的系统和方法
US10162891B2 (en) Determining demographics based on user interaction
US10698945B2 (en) Systems and methods to predict hashtags for content items
WO2016037525A1 (zh) 确定地图界面的方法和装置
US20170220693A1 (en) Assigning social networking system users to households
US10868789B2 (en) Social matching
US20160350675A1 (en) Systems and methods to identify objectionable content
US20170186042A1 (en) Systems and methods for promoting content items
US10713319B2 (en) Systems and methods to determine trending topics for a user based on social graph data
US9147202B1 (en) System and method of direct marketing based on explicit or implied association with location derived from social media content
KR20130099239A (ko) 소셜 네트워킹 시스템에서 제 3 자 웹페이지와 객체의 맵핑
PH12017000225A1 (en) Social network data processing and profiling
CN103782285B (zh) 对精确用户偏好数据的收集和管理
US20190205929A1 (en) Systems and methods for providing media effect advertisements in a social networking system
US20160358086A1 (en) Topical digital chatter analysis via audience segmentation
US10298655B2 (en) Systems and methods for providing content to verified entities
JP7202386B2 (ja) マルチプロフィールを提供する方法およびシステム
CN112634131A (zh) 用于数字内容的定制缩略图图像生成和选择
US10929770B2 (en) Systems and methods for recommending pages
EP2743882A1 (en) Unified social graph
CN111399731B (zh) 图片的操作意图处理方法、推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15765544

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15765544

Country of ref document: EP

Kind code of ref document: A1