WO2008019547A1 - Système et procédé de production d'informations descriptives d'un utilisateur de communication - Google Patents

Système et procédé de production d'informations descriptives d'un utilisateur de communication Download PDF

Info

Publication number
WO2008019547A1
WO2008019547A1 PCT/CN2007/000790 CN2007000790W WO2008019547A1 WO 2008019547 A1 WO2008019547 A1 WO 2008019547A1 CN 2007000790 W CN2007000790 W CN 2007000790W WO 2008019547 A1 WO2008019547 A1 WO 2008019547A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
user
communication
application template
record
Prior art date
Application number
PCT/CN2007/000790
Other languages
English (en)
French (fr)
Inventor
Guobing Min
Jieping Zhong
Fangshan Wang
Qi Fang
Original Assignee
Huawei Technologies Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co., Ltd. filed Critical Huawei Technologies Co., Ltd.
Priority to EP07711078A priority Critical patent/EP2051193A4/en
Priority to CNA2007800017320A priority patent/CN101361089A/zh
Publication of WO2008019547A1 publication Critical patent/WO2008019547A1/zh
Priority to US12/367,257 priority patent/US8171055B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to communication information collection techniques, and more particularly to a system and method for generating communication user description information. Background of the invention
  • ontology has become a research hotspot at home and abroad, and has appeared in many fields. Its research focuses on knowledge engineering, ontology engineering, information organization and retrieval, and semantic Web.
  • Various ontology description languages and ontology creation tools have also been developed and applied.
  • Prot ege is a free, open source ontology editor and knowledge management platform developed by the Stanford University School of Medicine Information Center.
  • J ena is a development kit for the ontology analysis and rule reasoning of the Semantic Web developed by Hewlett-Packard Company. It contains more comprehensive content.
  • Web ontology language OWL has become the recommendation standard of W3C. The application of ontology in traditional industries as well as emerging industries has become a trend.
  • Google's Gmail mailbox service launches 1G mailbox to serve users, and establishes user relationship network through mutual recommendation between netizens, and obtains some information of users such as social relations, thus generating some communication user description information.
  • new users of Gmail had to get an invitation from an old user to get an email account.
  • invitation rights between netizens collect the social relationship attributes of users and establish a social network.
  • the real implementation situation is that Gmail's old users are not limited to his friends.
  • Another method for generating communication user description information is: obtaining information about which types of email addresses the user communicates with by analyzing the user's mail sending and receiving records from the server side, thereby generating user description information according to the email address information, but the mail provider analyzes the mail.
  • the sending and receiving records can only establish a simple contact network, and these few communication user description information cannot truly reflect the user characteristics and requirements, which is inaccurate. Summary of the invention
  • the main object of the present invention is to provide a communication user description information.
  • the system can automatically generate communication user description information to ensure the accuracy of the generated communication user description information.
  • Another object of the present invention is to provide a method of generating communication user description information, which can automatically generate communication user description information and ensure the accuracy of the generated communication user description information.
  • a system for generating communication user description information comprising: an information labeling unit for labeling original information of a specific communication user, and for generating a user information generating unit that communicates user description information;
  • the information labeling unit includes an annotation module, an original resource database, an application template body library, and a specific user label library;
  • the original resource database is used to record the original information of the user to be marked;
  • the template ontology library is used to establish and store an application template describing the class and class attributes of the application for different applications, and the class and class attributes are from a a well-known or custom industry application or ontology;
  • the labeling module obtains the original information of the user to be marked from the original resource database, and according to the class to which the original information belongs, invokes the application template of the corresponding class in the application template ontology library, and fills the information value of the corresponding application template in the original information into the application.
  • the annotation of the original information is implemented, and the marked original information is stored in a specific user annotation library;
  • the user information generating unit includes a user information generating module, a user information base, a policy pool, and a policy setting module;
  • the user information generating module obtains the communication record information from the outside, queries the specific user labeling library, and adds the contact party identification information that satisfies the condition to the communication user description information of the communication entity according to the information transmission policy of the non-specific user in the policy pool. Stored in the user information repository; or according to the information transfer policy of a specific user in the policy pool, the conditions will be met.
  • the party identification information, and the user annotation information stored in the specific user labeling library corresponding to the contact identifier information are added to the communication user description information of the communication body and stored in the user information database;
  • a policy setting module configured to set various user information delivery policies, and stored in the policy pool
  • a policy pool for storing various user information delivery policies and providing them to the user information generation module for use;
  • the system further includes: a pre-processing unit for pre-processing the communication record, the pre-processing unit comprising a recording pre-processing module and a new recording library, wherein
  • a recording preprocessing module configured to extract a preset target field from a field of communication record information acquired by the outside world, and simultaneously add an additional field generated by processing the communication record according to a preset requirement, and store the target field and the additional field New record
  • a new record library for storing target fields and additional fields to form a new communication record and for use by the user information generation module.
  • the information labeling unit further includes: a self-service module, configured to provide a user-oriented interface, use the self-service module, and update the result marked in the specific user labeling library by using the labeling module.
  • the self-service module is an operation platform, or a client in a client/server C/S architecture, or a client in a browser/server B/S architecture.
  • the labeling module further includes a mapping table of a field in the application template and a corresponding fuzzy field thereof;
  • the labeling module further includes: analyzing a fuzzy field corresponding to the field in the application template to extract a word-cutting function of the key segment.
  • the application template includes an application template name, and describes the H indicated by the application template name; An application template parameter of a related class attribute of the class; the application template name is the same as the name of the class.
  • the application template further includes: an association relationship between different classes.
  • a method for generating a communication user description information which pre-sets a user information delivery policy for deciding whether to add the contact information to the communication user description information of the communication entity, and the method further includes:
  • the contact party identification information in the communication record information that satisfies the condition is recorded in the communication user description information of the communication body, and then the process ends. ;
  • the contact identification information in the communication record information that satisfies the condition, and the user annotation information corresponding to the contact identification information are recorded to the communication subject.
  • the communication user description information In the communication user description information.
  • An application template for describing an ontology of a class and a class attribute of the application for a different application, where the method for generating the user annotation information includes:
  • the field value is recorded in the application template
  • the method of recording the corresponding field value in the original resource data record in the application template is: setting the value of the field in the application template to air.
  • the method for recording the corresponding field value in the original resource data record in the application template is: pre-setting a mapping table of the field in the application template and its corresponding fuzzy field; querying the mapping table to determine whether the original resource data record exists a fuzzy field of the field in the application template, if yes, analyzing and extracting a key field from the fuzzy field, and recording the value of the key field in a corresponding field of the application template; otherwise, applying the application The value of this field in the template is set to null.
  • the method for extracting the key segments by the analysis is: cutting word analysis.
  • the field described in the condition of the user information delivery policy does not exist in the obtained communication record information, and the determining whether the contact party identification information in the communication record information exists in the generated user annotation information includes:
  • a preset target field is extracted from the field of the acquired communication record, and an additional field generated by processing and generating the communication record information according to a preset request is formed into a new communication record information and stored.
  • the recorded user annotation information is:
  • the method further includes: establishing, in the communication user description information, a contact frequency or a closeness of the communication subject with the non-specific user or the specific user according to a combined operation relationship of the preset determined fields.
  • the application template is created based on an ontology language.
  • the application template includes an application template name and an application template parameter describing a related class attribute of the class indicated by the application template name.
  • the present invention obtains the user demand information and generates the communication user description information by applying the ontology to the communication field by analyzing the real communication record of the user. Moreover, the generated communication user description information truly reflects the characteristics and requirements of the communication user, and ensures the accuracy of the generated communication user description information.
  • the method of the invention is applicable to communication activities such as voice communication, data communication, and short message of a user.
  • FIG. 1 is a schematic structural diagram of a system for generating communication user description information in an embodiment provided by the present invention
  • FIG. 2 is a flow chart of a method for generating communication user description information in an embodiment provided by the present invention
  • FIG. 3 is a flow chart of implementing information annotation in an embodiment provided by the present invention.
  • FIG. 4 is a flow chart of a method for recording a user application template in an embodiment provided by the present invention.
  • FIG. 5 is a flow chart of an embodiment of the present invention. Mode for carrying out the invention
  • the main content of the embodiment of the present invention is: presetting a user information delivery policy; obtaining communication record information, determining whether the contact party identification information in the communication record information exists in the generated user annotation information, if not, according to a preset
  • the information delivery policy of the non-specific user in the user information delivery policy records the contact information of the contact party that satisfies the condition into the communication user description information of the communication entity; if yes, transmits the information according to the preset user information
  • the information delivery policy of the specific user in the policy records the contact identification information that satisfies the condition and the user annotation information corresponding to the contact identification information into the communication user description information of the communication entity.
  • the method of the invention is applicable to communication activities such as voice communication, data communication, and short message of a user.
  • the present invention will be described in terms of voice communication as an embodiment.
  • FIG. 1 is a schematic diagram showing the structure of a system for generating communication user description information in an embodiment provided by the present invention
  • the system of the present invention includes an information labeling unit 10 for annotating original information of a specific communication user, and for generating communication according to the communication record.
  • the user information generating unit 12 of the user description information will hereinafter be referred to as a user as a user.
  • the composition and connection relationship of each unit will be described in detail below.
  • the information labeling unit 10 includes an annotation module 100, an original resource database 101, an application template ontology library 102, and a specific user annotation library 103, wherein
  • the original resource database 101 is used to record the original information of the user to be marked, including the identification information and attribute information of the user, such as the original yellow page registration data of the enterprise: the enterprise category, the enterprise name, the phone number, the business introduction, the region, Address, fax, zip code, address, email, etc.
  • the class records the industry directory leaf node to which the company belongs, the company phone number as the identification information, and the remaining parameters as the attribute description information. It should be noted that the specific users mentioned in this article refer to the labeled communication users.
  • _ is set in the IM communication network, and the enterprise number and the ordinary user are also distinguished for the IM number, and the original resource database refers to the enterprise user information record of the IM.
  • the same processing can be in various services such as Email.
  • the application template ontology library 102 is configured to store and store an application template describing a class and a class attribute of the application for a different application, where the class and class attributes are from a well-known or custom Industry application domain ontology. Specifically, it is used to refer to the classification method of the original resource data for different applications, establish each class and its subclasses, and the ontology of various attributes, define the relationship between the class and the class, and class attributes and class attributes. The relationship between. At the same time, define the relationship between the class and the class attribute, indicate which class attribute should be described by a class and its subclasses, and finally derive the application template of the class from this relationship.
  • the original resource data may be manually classified, and the ontology of the class library is created.
  • the application template is created based on the ontology language, and the created method belongs to the prior art, and can be implemented by a tool currently created by many ontology, as mentioned in the background art.
  • An application template consists of two parts: an application template name, which is used to identify which class the application template describes, and the application template name is consistent with the name of the class; the application template parameter describes the related class attribute of the class indicated by the application template name.
  • each application template parameter corresponds to a type tag.
  • the types of application template parameters can be divided into delivery parameters, non-transitive parameters, and even more types.
  • the parameter can be passed to the user as a user description information record.
  • each industry has different characteristics, different application template parameters are needed to describe its attributes. For example, the automotive industry may have brand-like attributes to identify the car brands that the company operates or manufacture, while the food and beverage industry may There are no attributes of the brand category, more descriptions are parameters such as taste, decoration style and so on. Therefore, different application templates can be set for leaf nodes of different industry classifications. Each application template has a uniquely assigned template name and an application template parameter description for the industry in which the leaf node is located.
  • the application template of the automobile sales is taken as an example to illustrate the application template parameters that a specific user of the automobile sales class can have, as shown in Table 1: Company Name: Phone Number:
  • Group 2 Extended attributes (service attributes) '-- Brand: such as BMW, Beverly, Volkswagen, etc.
  • Table 1 describes in text the content that may be included in a car sales application template.
  • the parameters in the implementation are based on actual conditions, including but not limited to Table 2.
  • an ontology description language such as the World Wide Web Ontology Language (OWL) can be used to describe and record an application template. How to describe it in the prior art belongs to the prior art, and the present invention emphasizes different Application (class) to create different application templates.
  • OWL World Wide Web Ontology Language
  • the application template not only labels various application template parameters for the class, but also establishes the relationship between different classes.
  • the automobile sales in the automobile category can be related to the gasoline sales in the chemical category, and the users who express the automobile sales also have It may be the user of gasoline sales, this transfer relationship can enrich the collected user attributes.
  • the labeling module 100 is an i-processing module of the information labeling unit 10, and is used for labeling the original information of the user.
  • the original information of the user to be marked is obtained from the original resource database 101, and the application template of the corresponding class in the application template ontology library 102 is invoked according to the class to which the original information belongs, and the application template name and application corresponding to the application template in the original information are used.
  • the parameter values of the template parameter items are filled in the application template to obtain specific user information, and the obtained specific user information is stored in the specific user label library 103.
  • a specific user tag library 103 is used to store the tagged specific user information.
  • the specific user information that is annotated includes, but is not limited to, the identification information of a specific user. Such as the phone number, the name of the application template to which the specific user belongs, and the description information of the specific user.
  • the description information of the specific user includes but is not limited to basic attributes and extended attributes.
  • the specific user information is stored in a specific storage manner in the specific user annotation library 103, and Table 2 is an embodiment of the stored specific user information:
  • the information tagging unit 10 may further include a self-service module 104 for providing a user-oriented interface for the user to use the self-service module 104 and update the results marked in the specific user tag library 103 by the tagging module 100.
  • a self-service module 104 for providing a user-oriented interface for the user to use the self-service module 104 and update the results marked in the specific user tag library 103 by the tagging module 100.
  • the user is the system administrator, then this is equivalent to an operating platform such as the system interface; if it is for the labeled user, the client/server (C/S) architecture is adopted, at this time, the self-service module 104 is equivalent to the client, and the tagging module 100 and the specific user tagging library 103 are equivalent to the server.
  • the marked user logs in to the server through the client, and can modify its own tagged information through operations such as registration, login, and information update by the client.
  • the self-service module 104 can also use the liu.
  • the client in the browser/server (B/S) architecture is implemented.
  • the user information generating unit 12 includes a user information generating module 120, a user information library 121, a policy pool 122, and a policy setting module 123. among them,
  • the user information generating module 120 is a core module of the system of the present invention, and is configured to determine whether and how to generate communication user description information according to the user information delivery policy queried and invoked from the policy pool 122, and generate the generated communication user description information. Stored in the user repository.
  • the user information generating module 120 obtains the communication record information from the outside, queries the specific user labeling library 103, and determines whether the communication field in the communication record, that is, the identifier field value of the contact party, is stored, and if not stored, according to the non-user information transmission policy a specific user's information delivery policy, adding the contact party identification information that satisfies the condition to the communication user description information of the communication body and storing it in the user information database 121; if stored, transmitting the information according to the specific user in the user information delivery policy
  • the policy adds the contact identification information that satisfies the condition, and the user annotation information stored in the specific user annotation library 103 corresponding to the contact identification information to the communication user description information of the communication entity and stores it in the user information database 121.
  • the user annotation information is added to the user information repository 121, that is, the preference attribute is recorded in the communication user description information of the communication body, and if the preference attribute already exists, the preference attribute information is Make adjustments, such as adding no passable parameters, or changing the weights corresponding to the parameters; if the preference attribute does not exist, increase the preference attribute information.
  • the communication subject refers to the home subscriber of the communication record, for example, the caller number user in a caller record, and the communication body is identified by the subscriber number field in the bill record.
  • the policy setting module 123 is a management interface for the system administrator, and is used to set each User information delivery strategy. T is not the same situation. Classes have different characteristics, require a different set of user information transfer 3 ⁇ 4 policy. Set up a user letter £ delivery policy stored in the policy pool
  • the user information delivery policy includes establishing conditions for attribute establishment conditions of non-specific users and attributes of specific users.
  • the non-specific user here is relative to a specific user, and refers to a user who does not exist in the specific user tag library 103.
  • the condition for the attribute establishment of the non-specific user determines whether or not the non-specific user is added to the communication user description information of the communication subject, and the condition established for the attribute of the specific user determines whether or not the specific user is added to the communication user description information of the communication subject.
  • the specific content of the user information delivery policy is a combination of field value restriction descriptions, where the fields are from the communication record.
  • a user information transfer policy can be described by the formula (1):
  • I represents a user information delivery strategy content
  • Q represents different field values
  • ie constraints
  • n represents before and after
  • the relationship between the constraints is a sum, as shown in equation (1), only if all of the constraints Q! Qn are met, it is considered that the condition is met and the user information transfer policy is met.
  • the formula (1) is only an expression of the user information transmission strategy, and the pre- and post-conditions may also be an OR relationship, or a partial relationship may be an OR relationship, etc. List them one by one.
  • Table 3 shows the user information delivery strategy content and corresponding meanings of the specific users whose application template names are car sales and car repair:
  • Car sales ⁇ (number of calls > 1 ) ⁇ As long as the transferable information of the car sales contact party that has more than one call is satisfied, the communication user description letter of the communication subject will be recorded. Interest
  • Car repair I 2 ⁇ (calls > 3) ⁇ (pass only meets the number of calls more than three words total length > 00:15:00) ⁇ times, and the total length of the call is more than fifteen minutes for the car repair contact Information will be recorded in the communication user description information of the communication subject.
  • the policy pool 122 is configured to store various user information delivery policies and provide them to the user information generating module for use.
  • an application template name corresponds to a user information delivery policy
  • the user information generation module 120 queries and invokes the corresponding user information delivery policy in the policy pool 120 according to the application template name to which the original resource data belongs.
  • the user information database 121 is configured to store a user description information file of the communication body, including but not limited to the user's identification ID, the user's social relationship attribute, and the preference attribute.
  • the contact weight is a parameter indicating the degree of relationship between the users, and can be obtained according to a certain combination operation of the specific field. Represents the frequency or intimacy of the communication subject's contact with the non-specific user or specific user.
  • the preference attribute is mainly composed of the transferable parameters of different application templates, and describes the characteristics of specific users who have established social relationships. After satisfying the conditions for establishing social relations, these characteristics are passed to the communication subject for describing the communication user description information of the communication subject.
  • Table 4 is an example of a user information record, in which the user 1 represents a communication subject, and the communication user description information of the communication body includes information of the non-specific user 1, the non-specific user 2, the specific user 1 and the specific user 2, and the preference Attributes are applied by template 1 and application template 2 A transitive parameter component that describes the characteristics of a particular user 1 and a specific user 2 who have established a social relationship.
  • the information tagging unit 10 and the user information generating unit 12 can be two independent servers.
  • the system of the present invention may further include a preprocessing unit 11 for using the communication record. Performing pre-processing, extracting a preset target field from the original communication record field to compose a new record and storing, the target field includes at least a communication subject identifier field identifying the communication record owner, a contact party identifier field identifying the communication object, and also includes The communication record is processed accordingly and the resulting additional fields are generated according to the preset requirements.
  • the pre-processing unit 11 mainly includes a recording pre-processing module 110 and a new recording library 111. among them,
  • the record preprocessing module 110 is configured to preprocess the communication record information acquired from the outside world, extract a preset target field from the original communication record field to form a new record, and store the new record, and the new record further includes: The communication record is processed accordingly and the resulting additional fields.
  • a new communication record is composed of the target field and the additional field, and is stored in the new record library 111.
  • Table 5 is an original bill list record, including the user number, serial number, call origin, calling and called type, call type, and other party number. Call date, call time, call duration, mobile phone bill and long distance call. Assume that the preset target fields are user number, serial number, counterpart number, number of calls, and total duration of calls. As can be seen from Table 5, the user number, serial number, and counterpart number can be directly extracted from the original bill list record, and the number of calls and calls.
  • the new record library 111 is configured to store the preprocessed communication record, and the user information generating module 120 acquires the required communication record from the new record library 111.
  • the record field is preset by the record pre-processing module 110. According to the above example, the CDR records that have been preprocessed into the new record library 111 are as shown in Table 6:
  • the subscriber number field indicates that the bill record is the bill of the communication user corresponding to the subscriber number, and the number of calls refers to the total number of similar bill entries, and the total duration of the call refers to the sum of the durations of the same bills.
  • FIG. 2 is a flowchart of a method for generating communication user description information in an embodiment provided by the present invention.
  • the method can be executed by a preset timer or executed by a background administrator.
  • the method includes the following steps:
  • Step 200 Set the user information delivery policy in advance.
  • User information delivery policies include establishing conditions and specific uses for non-specific user attributes
  • the attribute establishment condition of the user determines whether the non-specific user related information is added to the communication user description information of the communication subject for the attribute establishment condition of the non-specific user, and the condition for establishing the attribute of the specific user determines whether to add the specific user related information to the communication.
  • the communication user description information of the subject The information transfer policy has been described in detail when describing the policy setting module 123, and will not be repeated here.
  • Step 201 Acquire communication record information, determine whether the contact identification information in the communication record information exists in the generated user annotation information, and if yes, proceed to step 203; otherwise, proceed to step 202.
  • the method of obtaining the communication record can be obtained by many means, such as reading from a database storing the communication record, and the specific implementation is not related to the present invention, and will not be described in detail herein.
  • Step 202 Record the contact identification information in the communication record information that meets the condition in the communication user description information of the communication entity according to the information delivery policy of the non-specific user in the preset user information delivery policy, and then end the process.
  • the contact identifier can be a phone number or the like.
  • Step 203 Record, according to the information transmission policy of the specific user in the preset user information delivery policy, the contact identification information in the communication record information that satisfies the condition, and the user annotation information corresponding to the contact identifier information, to the communication entity.
  • the communication user description information In the communication user description information.
  • the user annotation information corresponding to the contact identifier information may be obtained from the generated user annotation information when it is determined in step 201 that the contact identifier information in the communication record information exists in the generated user annotation information.
  • the information may be transmitted, or may be the transferable information obtained from the generated user annotation information according to the contact identifier after the condition is determined in step 203.
  • the method for the user to mark the information is: traversing a preset preference attribute in the user description information of the communication subject user, and determining whether the class to which the user annotation information belongs exists in the preference attribute, if not, if Timing attribute of the communication subject user Adding the class to which the user tag information belongs and the passable parameter therein; if yes, further determining whether the passable parameter in the user tag information exists in the preference attribute, if yes, ending; if not, The transferable parameter in the user annotation information is added in the preference attribute.
  • FIG. 3 is a flowchart of implementing information annotation in the embodiment provided by the present invention, including the following steps:
  • Step 300 Extract a raw resource data record, and obtain a class name of the class to which the record belongs.
  • a raw resource data record refers to a record in the communication record information.
  • Step 301 Call an application template corresponding to the class name according to the obtained class name, and record the corresponding field value in the record in the application template according to the field included in the invoked application template.
  • the application template is pre-set.
  • Method 1 ignore this field and set the value of this field in the application template to null.
  • the value of this field can be manually configured by the enterprise or administrator through the self-service platform.
  • Step 400 Extract the fields in the application template.
  • Step 401 Whether the field exists in the original resource data record, if yes, then Proceed to step 405; otherwise, proceed to step 402.
  • Step 402 Whether there is a fuzzy field of the field in the original resource data record, if yes, proceed to step 403; otherwise, proceed to step 404.
  • Step 403 Analyze the key field from the fuzzy field, record the value of the key field in the application template, and then end.
  • the existing word segmentation method can be used to analyze the fuzzy field and extract valid keywords.
  • the existing word segmentation method can be used to analyze the fuzzy field and extract valid keywords.
  • the annotation module 100 further includes a word segmentation analysis function.
  • Step 404 Set the value of the field in the application template to null, and then end.
  • Step 405 Record the value of the field in the application template.
  • mapping table An example of a mapping table is given below in conjunction with the example shown in Table 7:
  • the registration information includes the company's phone number, company name, industry, address, company, and "BMW" in the company profile.
  • the parameters on the calling car sales application template are phone number, company name, address, brand, where the brand field has alternative values: Mazda, BMW, Nissan, Volkswagen, etc.
  • the fuzzy field is obtained from the mapping table shown in Table 7 as the company profile, and is cut from the company profile field of the original resource data record. Word analysis, the value of "BMW" as the brand field is written to the brand field in the car sales application template.
  • Step 302 Store the application template that completes the record.
  • Step 303 Determine whether there is still a source resource database, and if yes, return to step 300; otherwise, end.
  • the tagged specific user information is stored in the specific user tag library 103.
  • an important process is to call the application template to describe a specific user.
  • the application template is based on the ontology language design.
  • the labeling module 100 automatically generates an annotation information file of the specific user information described by the original resource data, and completes the attribute information annotation of the specific user.
  • Table 8 is the information of the car sales company before the label:
  • the method of the present invention may further include recording the communication Line preprocessing, that is, extracting a preset target field from the original communication record field to compose a new record and storing the target field at least including a communication subject identification field identifying the communication record owner, a contact party identification field identifying the communication object, and a new
  • the record also includes additional processing of the communication record in accordance with the preset requirements and the resulting additional fields.
  • the setting of the target field differs depending on the format of the communication log and is set by the administrator.
  • the following describes a method for preprocessing by combining a pre-processing of the original bill list.
  • the pre-processing is in the format of the original bill list
  • the set target field includes the user number, the serial number, the counterpart number, that is, the contact identifier field, and the corresponding processing of the communication record according to the requirement is to merge the bill record with the same party number
  • Additional fields include the number of calls and the total duration of the call.
  • Table 11 User number serial number, number of calls, total number of calls 13526843612 1 13343857303 4 01 : 17: 19
  • the call distance can also be considered as a parameter for judging the degree of relationship between the two parties.
  • FIG. 5 is a flowchart of an embodiment, which includes the following steps:
  • Step 500 Determine whether there is a user communication record. If yes, go to step 501; otherwise, end.
  • the user information generating module 120 extracts a set of pre-processed CDRs from the new record library 111, as shown in Table 12, wherein the user number is the communication subject identification field, and the counterpart number is the contact party identification field. Therefore, the result of the judgment in this step is that there is a user communication record.
  • Step 501 to step 503 Obtain a user communication record, and obtain a communication subject identifier from the record, and determine whether there is information of the communication subject corresponding to the communication subject identifier, if yes, proceed to step 504; if not, Create a record of user information for this communication body.
  • the user information generating module 120 traverses the user information database 121, and determines whether the user number 13526436612 is recorded in the user information database 121. If not recorded, the user information record file of the user (such as Table 4) is created, that is, in the user information database. Generate this user
  • Step 504 Obtain a contact identifier from the user communication record.
  • the user information generating module 120 reads the contact identification number of the communication record shown in Table 13, that is, the other party number is 13343857303.
  • Step 505 Determine whether there is any annotation information of the contact party, if yes, proceed to step 507; otherwise, proceed to step 506.
  • Step 506 Invoke the information delivery policy of the non-specific user, and proceed to step 508.
  • Step 507 Invoke a specific user's messaging policy.
  • Step 508 Determine whether the condition is met. If yes, proceed to step 509; otherwise, return to step 500.
  • the user information generating module 120 sequentially reads the number of calls and the total duration of the call in the user communication record shown in Table 13 according to the field described in the information delivery policy Ip of the non-specific user, and determines whether the IP is satisfied. The conditions set in .
  • the number of calls shown in Table 13 is four times, and the total duration of the call is one hour, seventeen minutes, and nineteen seconds, all satisfying the condition set in Ip, that is, the number of calls is greater than three.
  • the total duration of the call is more than thirty minutes.
  • Step 509 Record the information of the contact party, and return to step 500.
  • the contact value of the contact party can be generated and recorded.
  • the contact weight is the ratio of the number of calls to the contact party to the total number of calls in a certain period of time.
  • the above process completes the information of the non-specific user 13343857303 as the generation process of the user description information of the communication body 13526843621.
  • the second record is extracted, and it is assumed that the other party's number 13892983773 is a non-specific user in the second record, and the flow shown in FIG. 5 can be used to obtain the information transfer strategy of the non-specific user, and the second is found.
  • the number of calls in the record is one, and the total duration of the call is two minutes and twenty-six seconds.
  • the condition set in Ip is not met, so the record is ignored, that is, discarded.
  • 0755-26710686 is a specific user, the contact party 0755-26710686 belongs to the category of automobile sales, and the contact information of the contact party is shown in Table 9.
  • the flow shown in FIG. 5 can be used.
  • the specific user labeling library 103 reads the application template name to which the 0755-26710686 belongs from the annotation information, and invokes the information of the specific user corresponding to the application template from the policy pool 122. Delivery strategy.
  • the contact value of the contact party is generated and recorded. 4.
  • the contact weight is the ratio of the number of calls to the contact party to the total number of calls during a certain period of time. As shown in Table 12, the contact value of the contact party 0755-26710686 during the period of the four records.
  • the method of recording the transferable parameter in the user tag information corresponding to the party number 0755-26710686 is to add a corresponding preference attribute to the user description information.
  • the specific method is: first traversing the preference attribute of the communication subject user, and determining whether there is an attribute record of the automobile sales category in the preference attribute of the communication subject user.
  • the communication subject user first contacts the specificity of the automobile sales category. The user, so the car sales class record and the corresponding passable parameters are added directly in the user preference attribute, which in this embodiment assumes that the transferable parameters of the car sales template are brands and service items.
  • Extract the fourth record assuming that the contact class 0755-82391435 belongs to the car sales category, the contact information of the contact party is shown in Table 9, and the processing flow is the same as the third record, only in the process of adding the last preference attribute, due to Originally, there is already a preference attribute record of the car sales category. Therefore, when processing this record, it is necessary to determine whether there is a transferable parameter in the tag information of the contact party 0755-82391435 in the preference attribute record, and if so, no operation is performed. Or add the passable parameter in the annotation information of the contact party 0755-82391435 and overwrite the original record; if not, add the passable parameter in the annotation information of the contact party 0755-82391435 to the preference attribute to update Preferences attribute.
  • the above description is only made by using the bill list as an embodiment.
  • the scheme of the present invention is also applicable to the communication methods such as Emai l and IM, such as labeling the enterprise Ema il and the IM number.
  • the solution of the present invention is also applicable to the processing of the data service such as the CRBT downloading.
  • the corresponding ontology description template can be created for each type of CRBT, and the CRBTs provided by the service provider (SP) are marked as specific users, and then the user is marked.
  • SP service provider
  • the user description information is analyzed in the service record of the data service.

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Telephonic Communication Services (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Description

一种生成通信用户描述信息的系统及方法 技术领域
本发明涉及通信信息收集技术, 尤指一种生成通信用户描述信息的 系统及方法。 发明背景
随着现代通信技术的发展, 人与人之间的交流工具日趋多样化, 从 以话音为代表的固定电话和移动电话, 以文字信息为主的 Email、 移动 Email, 到融合了语音、 文字甚至图片的即时消息 (IM ) 交流; 从环球 网 ( Web ) 1.0的论坛到 Web2.0的博客( Blog )。 同时各种交流方式也渐 趋融合, 比如, 用户可以仅仅通过一个移动终端, 即可完成话音通信、 Email收发、 IM交流, 更可通过各种数据业务如移动 Blog、 图片 Blog、 播客 ( Podcast )等完成信息交流。
有关资料表明, 在现有条件下, 一个具有 70万 G网用户的地区, 一个月将产生 1.7亿条话单记录。 人与人之间的通信行为可以建立起一 个巨大的社会关系网, 同时, 在这些交流中蕴涵着丰富的反应用户特征 与需求的通信用户描述信息, 比如, 某人经常打证券公司的服务电话, 即可推断此人有可能是股民, 投资理财类的产品可能会引起该用户的兴 趣, 由此, 可以将证券公司的某些属性传递给该用户。 在以用户为中心 的今天, 如何获取通信用户描述信息成为一个很有意义的课题。
另一方面, 本体论已然成为国内外研究热点, 在多个领域出现了具 体应用,其研究集中在知识工程、本体工程、信息组织与检索和语义 Web 等方面。各种本体描述语言和本体创建工具也逐渐被开发和应用。比如, Prot e g e是由斯坦福大学医学院医学信息中心开发的免费、开放源码的 本体编辑器和知识管理平台。 jena是惠普(HP )公司开发的面向语义网 的本体解析、 规则推理等应用的开发包, 包含的内容比较全面。 本体语 言方面, Web本体语言 OWL已经成为 W3C的推荐标准。 在传统行业以及 新兴行业应用本体论已经成为一种趋势。
将本体论应用在通信世界中, 用本体语言来描述各通信主体的属性 特征, 进而捕捉属性特征在社会网络中的传递情况, 这对于获取作为主 要通信主体的用户的描述信息具有重要意义。
Google公司的 Gmail邮箱服务在推出 1G邮箱为用户服务的同时, 通 过网友之间的相互推荐建立用户关系网, 获取了用户的一些信息比如社 会关系情况, 从而生成了一些通信用户描述信息。 早期, Gmail的新用 户必须获得老用户的邀请才能取得邮箱帐号, 通过网友之间邀请权限的 使用, 收集用户的社会关系属性, 建立一个社会网络。 然而, 真正的实 施情况是 Gmail的老用户邀请的并不限于他的朋友, 在 Gmail推出初期, 很多 Gmail拥有者在网上公开销售邀请权限, 而当 Gmail普及之后, 可以 很容易在网上获取 Gmail邀请权限。 这样, 导致了基于邀请权限建立起 来的社会关系并不准确, 也就是生成的通信用户描述信息不准确。
另一种生成通信用户描述信息的方法是: 通过从服务器侧分析用户 的邮件收发记录获取用户与哪些类型的邮箱地址通信, 从而根据这些邮 箱地址信息生成用户描述信息, 但是邮件提供商通过分析邮件的收发记 录只能建立简单的联系网络, 而这些很少的通信用户描述信息是不能真 实反应用户特征与需求的, 是不准确的。 发明内容
有鉴于此, 本发明的主要目的在于提供一种生成通信用户描述信息 的系统, 该系统能够自动生成通信用户描述信息, 保证生成的通信用户 描述信息的准确性。
本发明的另一目的在于提供一种生成通信用户描述信息的方法, 该 方法能够自动生成通信用户描述信息, 保证生成的通信用户描述信息的 准确性。
为达到上述目的, 本发明的技术方案具体是这样实现的: 一种生成通信用户描述信息的系统, 该系统包括: 用于对特定通信 用户的原始信息进行标注的信息标注单元, 以及用于生成通信用户描述 信息的用户信息生成单元;
其中, 信息标注单元包括标注模块、 原始资源数据库、 应用模板本 体库和特定用户标注库;
原始资源数据库, 用于记录需要标注的用户的原始信息; 应用模板本体库, 用于针对不同的应用, 建立描述该应用的类与类 属性的应用模板并存储, 所述类与类属性来自一个公知的或自定义的行 业应用领或本体;
标注模块, 从原始资源数据库中获取需要标注的用户的原始信息, 根据该原始信息所属类, 调用应用模板本体库中相应类的应用模板, 将 原始信息中对应应用模板的信息值填入该应用模板中, 实现对该原始信 息的标注, 并将经过标注的原始信息存储在特定用户标注库中;
用户信息生成单元包括用户信息生成模块、 用户信息库、 策略池和 策略设置模块;
用户信息生成模块, 从外界获取通信记录信息, 查询特定用户标注 库, 按照策略池中的非特定用户的信息传递策略, 将满足条件的联系方 标识信息添加到通信主体的通信用户描述信息中并存储在用户信息库 中; 或者按照策略池中的特定用户的信息传递策略, 将满足条件的联系 方标识信息, 以及该联系方标识信息对应的存储在特定用户标注库中的 用户标注信息, 添加到通信主体的通信用户描述信息中并存储在用户信 息库中;
策略设置模块, 用于设置各种用户信息传递策略, 并存储到策略池 中;
策略池, 用于存储各种用户信息传递策略, 并提供给用户信息生成 模块使用;
' 用户信息库, 用于存储通信主体的用户描述信息文件。
所述系统还包括: 用于对通信记录进行预处理的预处理单元, 该预 处理单元包括记录预处理模块和新记录库, 其中,
记录预处理模块, 用于从外界获取的通信记录信息的字段中提取预 先设定的目标字段, 同时按照预设要求对通信记录进行处理后产生的附 加字段, 并存储目标字段和附加字段组成的新记录;
新记录库, 用于存储目标字段和附加字段组成新的通信记录, 并提 供给用户信息生成模块使用。
所述信息标注单元还包括: 自服务模块, 用于提供一个面向用户的 接口, 使用自服务模块, 并通过所述标注模块对特定用户标注库中标注 的结果进行更新。 1
所述自服务模块为一操作平台,或者客户端 /服务器 C/S架构中的客 户端, 或者浏览器 /服务器 B/S架构中的客户端。
所述标注模块中进一步包括所述应用模板中的字段与其对应的模 糊字段的映射表;
所述标注模块还包括: 对所述应用模板中的字段对应的模糊字段进 行分析以提取关键字段的切词功能。
所述应用模板包括应用模板名称, 及描述该应用模板名称所指示 H; 类的相关类属性的应用模板参数; 所述应用模板名称与所述类的名称相 同。
所述应用模板还包括: 不同类之间的关联关系。
一种生成通信用户描述信息的方法, 预先设置决定是否将联系方信 息加入通信主体的通信用户描述信息中的用户信息传递策略, 该方法还 包括:
获取通信记录信息, 判断通信记录信息中的联系方标识信息是否存 在于生成的用户标注信息中,
若不存在, 按照预设的用户信息传递策略中的非特定用户的信息传 递策略, 将满足条件的通信记录信息中的联系方标识信息记录到通信主 体的通信用户描述信息中, 之后结束本流程;
若存在, 按照预设的用户信息传递策略中的特定用户的信息传递策 略, 将满足条件的通信记录信息中的联系方标识信息, 以及该联系方标 识信息对应的用户标注信息记录到通信主体的通信用户描述信息中。
预先设置针对不同的应用, 用于描述该应用的类与类属性的本体的 应用模板, 所述用户标注信息的生成方法包括:
提取一条原始资源数据记录, 并获取该记录的所属类的类名称; 根据获得的类名称, 调用对应该类名称的应用模板, 并根据调用的 应用模板中包括的字段, 将该记录中对应的字段值记录在该应用模板 中;
存储完成记录的应用模板。
若所述应用模板中的部分字段在原始资源数据记录中不存在, 则所 述将原始资源数据记录中对应的字段值记录在应用模板中的方法为: 将 应用模板中该字段的值设置为空。
若所述应用模板中的部分字段在原始资源数据记录中不存在, 则所 述将原始资源数据记录中对应的字段值记录在应用模板中的方法为: 预先设置应用模板中的字段与其对应的模糊字段的映射表; 查询映射表, 判断所述原始资源数据记录中是否存在所述应用模板 中该字段的模糊字段, 若存在, 从该模糊字段中分析提取关键字段, 并 将该关键字段的值记录在所述应用模板的对应字段中; 否则, 将所述应 用模板中该字段的值设置为空。
所述分析提取关键字段的方法为: 切词分析。
^获取的通信记录信息中不存在所述用户信息传递策略的条件中 描述的字段, 则所述判断通信记录信息中的联系方标识信息是否存在于 生成的用户标注信息中之前, 还包括:
。 从所述获取的通信记录的字段中提取预先设定的目标字段, 以及按 照预设要求对所述通信记录信息进行处理并产生的附加字段, 组成新的 通信记录信息并存储。
若所述通信记录信息中的联系方标识信息存在于生成的用'户标注 信息中, 所述记录的用户标注信息的方法为:
遍历所述通信主体用户的用户描述信息中预设的偏好属性, 判断该 偏好属性中是否存在所述用户标注信息所属的类, 若不存在, 则在该通 信主体用户的偏好属性中添加所述用户标注信息所属的类及其中的可 传递参数;
若存在, 则进一步判断该偏好属性中是否存在所述用户标注信息中 的可传递参数, 若存在, 结束; 若不存在, 则将所述用户标注信息中的 可传递参数添加在该偏好属性中。
该方法进一步包括: 在所述通信用户描述信息中, 根据预设的栺定 字段的组合运算关系, 建立通信主体与所述非特定用户或特定用户的联 系频繁度或亲密度。 所述应用模板是基于本体语言创建的。
所述应用模板包括应用模板名称, 及描述该应用模板名称所指示的 类的相关类属性的应用模板参数。
由上述技术方案可见, 本发明通过将本体论应用到通信领域中, 通 过对用户的真实通信记录的分析, 获得了用户需求信息并生成了通信用 户描述信息。 而且, 生成的通信用户描述信息, 真实地反应了通信用户 的特征与需求, 保证了生成的通信用户描述信息的准确性。
本发明方法适用于用户的语音通信、 数据通信、 短信等通信行为。 附图简要说明
图 1是本发明提供的实施例中生成通信用户描述信息的系统组成结 构示意图;
图 2是本发明提供的实施例中生成通信用户描述信息的方法的流程 图;
图 3是本发明提供的实施例中实现信息标注的流程图;
图 4是本发明提供的实施例中一种记录用户应用模板的方法的流程 图;
图 5是本发明实施例的流程图。 实施本发明的方式
本发明的实施例的主要内容是: 预先设置用户信息传递策略; 获 取通信记录信息,判断通信记录信息中的联系方标识信息是否存在于 生成的用户标注信息中, 若不存在, 按照预设的用户信息传递策略中 的非特定用户的信息传递策略,将满足条件的联系方标识信息记录到 通信主体的通信用户描述信息中; 若存在, 按照预设的用户信息传递 策略中的特定用户的信息传递策略, 将满足条件的联系方标识信息, 以及该联系方标识信息对应的用户标注信息记录到通信主体的通信用 户描述信息中。
为使本发明的目的、 技术方案及优点更加清楚明白, 以下参照附图 并举较佳实施例, 对本发明进一步详细说明。
本发明方法适用于用户的语音通信、数据通信、短信等通信行为。 本发明将以话音通信作为实施例来描述实现过程。
图 1是本发明提供的实施例中生成通信用户描述信息的系统组成结 构示意图, 本发明系统包括用于对特定通信用户的原始信息进行标注的 信息标注单元 10, 以及用于根据通信记录生成通信用户描述信息的用户 信息生成单元 12, 以下将通信用户筒称为用户, 下面详细介绍各单元的 组成及连接关系。
(一 )信息标注单元 10包括标注模块 100、 原始资源数据库 101、 应用模板本体库 102和特定用户标注库 103, 其中,
原始资源数据库 101 , 用于记录需要标注的用户的原始信息, 包 括描述用户的标识信息和属性信息, 比如企业原始的黄页注册数据: 企业所属类、 企业名称、 电话号码、 业务介绍、 所在地区、 地址、 传 真、 邮编、 地址、 Email等。 其中, 所属类记录该公司所属的行业目 录叶节点,公司电话号码作为标识信息,剩余参数作为属性描述信息。 需要说明的是, 本文中提到的特定用户是指经过标注的通信用户。
_设在 IM通信网络中,对于 IM号也区分企业用户和普通用户, 那么原始资源数据库指 IM的企业用户信息记录。 同样的处理可以是 Email等各种具有号码的服务中。
应用模板本体库 102, 用于针对不同的应用, 建立描述该应用的类 与类属性的应用模板并存储, 所述类与类属性来自一个公知的或自定义 的行业应用领域本体。 具体来讲, 用于针对不同的应用, 参照原始资 源数据的分类方式, 建立各大类及其子类、 以及各类属性的本体, 定 义类与类之间的关系和类属性与类属性之间的关联。 同时, 定义类与 类属性之间的关系, 指明一个类及其子类应该由哪些类属性来描述, 最终由这个关系导出类的应用模板。 需要说明的是, 如果原始资源数 据没有进行分类, 可以人工为原始资源数据分类, 同时创建类库的本 体。 这里, 应用模板是基于本体语言创建的, 创建的方法属于现有技 术, 可以通过目前许多本体创建的工具来实现, 如背景技术中提到的
Prot g 平台等, 这里不再详述。
一个应用模板由两部分组成: 应用模板名称, 用于标识该应用模 板是描述哪个类的, 应用模板名称与类的名称一致; 应用模板参数, 描述该应用模板名称所指示的类的相关类属性,在设置应用模板参数 时, 每个应用模板参数对应一个类型标签。 应用模板参数的类型可以 分为传递参数、 非传递参数, 甚至更多类型, 当一个参数被设为传递 参数时, 该参数可以传递给用户作为用户描述信息记录。
由于每个行业具有不同的特点,需要不同的应用模板参数对其属 性进行描述, 比如汽车类行业可能具有品牌类的属性, 用于标识该公 司经营或制造的汽车品牌, 而餐饮类行业则可能不存在品牌类的属 性, 更多描述的是口味、 装修风格等参数。 所以, 可以针对不同行业 分类目录的叶节点, 设置不同的应用模板。 每个应用模板具有唯一分 配的模板名称和针对该叶节点所在行业的应用模板参数描述。
下面以汽车销售的应用模板为例,说明汽车销售类特定用户可以 具有的应用模板参数, 如表 1所示:
Figure imgf000011_0001
公司名称: 电话号码:
地址: 城市:
由 P编: 网址 ··
组 2: 扩展属性 (服务属性) ' —― 品牌: 如宝马、 富康、 大众等
服务项: 如汽车销售、 汽车保险、 汽车保养等
表 1
表 1 用文字的方式描述了一个汽车销售应用模板可能包含的内 容,具体实现中的参数根据实际情况而定,包括但不仅限于表 2所示。 在实际的实现过程中,可以利用本体描述语言如环球网本体描述 语言(OWL, Web Ontology Language )对应用模板进行描述和记录, 具体如何进行描述属于现有技术, 本发明强调的是针对不同的应用 (类)建立不同的应用模板。
应用模板不仅仅为类标注各种应用模板参数,还可以建立不同类 之间的关联关系,如汽车类中的汽车销售可以与化工类中的汽油销售 建立关联关系, 表示汽车销售的用户同时有可能是汽油销售的用户, 这种传递关系能够丰富所收集的用户属性。
标注模块 100, 是信息标注单元 10的 i 辑处理模块, 用于对用户的 原始信息进行标注。 从原始资源数据库 101中获取记录的需要标注的用 户的原始信息, 根据该原始信息所属类, 调用应用模板本体库 102中相 应类的应用模板, 将原始信息中对应应用模板的应用模板名称和应用模 板参数项的参数值填入该应用模板中, 从而获得特定用户信息, 并将获 得的特定用户信息存储在特定用户标注库 103中。
对特定用户属性进行标注的过程中, 可以针对不同类型行业的用 户, 调用不同的应用模板进行特定用户信息的标注。
特定用户标注库 103, 用于存储经过标注的特定用户信息。
经过标注的特定用户信息包括但不仅限于特定用户的标识信息 如电话号码、 特定用户所属的应用模板名称、 特定用户的描述信息。 其中, 特定用户的描述信息包括但不限于基本属性和扩展属性。 特定 用户信息在特定用户标注库 103中以一种可行的存储方式进行存储, 表 2是存储的特定用户信息的一个实施例:
<特定用户 1>
<标识号码 > </标识号码 >
- <模板名称>汽车销售 </模板名称>
<属性参数>
<组 1 : 基本属性>
<企业名称 ></企业名称>
<地区 ></地区 >
<地址></地址 >
<由|5 ¾ ></由 >
<网址 ></网址 >
</组 1 : 基本属性> . ―
<组2: 扩展属性 >
<品牌 ></品牌 >
<服务项 ></服务项 >
</组 2: 扩展属性 >
</属性参数>
</特定用户 1 >
表 2
信息标注单元 10还可以进一步包括自服务模块 104, 用于提供 一个面向用户的接口, 让用户可以使用自服务模块 104, 并通过标注 模块 100对特定用户标注库 103中标注的结果进行更新。如果是面向 的用户是系统管理员, 那么这个相当于是一个操作平台如系统界面; 如果面向的是被标注的用户, 则采用客户端 /服务器 (C/S ) 的架构, 此时, 自服务模块 104相当于客户端, 标注模块 100和特定用户标注 库 103相当于服务器。 被标注的用户通过客户端登录到服务器, 可以 通过客户端进行注册、登录、信息更新等操作修改自身的标注的信息。 这里, 由于 C/S结构是比较常用的现有架构, 且属于本领域技术人员 公知技术, 所以这里不再详述, 另外, 自服务模块 104也可以采用浏 览器 /服务器 (B/S ) 架构中的客户端来实现。
(二)用户信息生成单元 12包括用户信息生成模块 120、 用户信息 库 121、 策略池 122和策略设置模块 123。 其中,
用户信息生成模块 120, 是本发明系统的一个核心模块, 用于根 据从策略池 122中查询并调用的用户信息传递策略,决定是否和如何 生成通信用户描述信息,并将生成的通信用户描述信息存储在用户信 息库中。
用户信息生成模块 120从外界获取通信记录信息,查询特定用户 标注库 103 并判断其中是否存储有通信记录中的通信对象即联系方 的标识字段值, 若未存储, 按照用户信息传递策略中的非特定用户的 信息传递策略,将满足条件的联系方标识信息添加到通信主体的通信 用户描述信息中并存储在用户信息库 121中; 若存储有, 按照用户信 息传递策略中的特定用户的信息传递策略,将满足条件的联系方标识 信息, 以及该联系方标识信息对应的存储在特定用户标注库 103中的用 户标注信息添加到通信主体的通信用户描述信息中并存储在用户信 息库 121中。
如果通信对象为特定用户标注库中的特定用户, 将用户标注信息 添加到用户信息库 121 中即在通信主体的通信用户描述信息中记录 偏好属性, 如果该偏好属性已存在, 则对偏好属性信息进行调整, 如 增加没有的可传递参数, 或更改参数对应的权值等; 如果该偏好属性 不存在, 则增加该偏好属性信息即可。
这里, 通信主体指通信记录的归属用户, 比如在一条主叫话单记 录中为主叫号码用户,此时通信主体由话单记录中的用户号码字段标 识。
策略设置模块 123 , 是面向系统管理员的管理接口, 用于设置各 种用户信息传递策略。 实际情况是不 t同.的类具有不同特征, 需要设置 不同的用户信息传 ¾策略。设置好的用户信£传递策略存储在策略池
122中。
用户信息传递策略包括针对非特定用户的属性建立条件和特定 用户的属性建立条件。 这里的非特定用户是相对特定用户而言的, 指 在特定用户标注库 103中不存在的用户。针对非特定用户的属性建立 的条件决定是否将非特定用户加入通信主体的通信用户描述信息中, 针对特定用户的属性建立的条件决定是否将特定用户加入通信主体 的通信用户描述信息中。
用户信息传递策略具体内容是字段值限制条件描述的组合,这里 的字段来自通信记录。一条用户信息传递策略可以用运算式描述为式 (1)所示:
i= {QinQ2n...nQn} (η>=ι) (ι) 式(1.)中, I表示一条用户信息传递策略内容, Q表示不同的字 段值即限制条件, n表示前后的限制条件间为和的关系, 如式 (1) 所示, 只用全部满足限制条件 Q! Qn, 才认为满足条件, 符合用户 信息传递策略。 需要说明的是, 式 (1)仅仅是用户信息传递策略的 一种表达方式, 前后的限制条件间也可以为或的关系, 也可以部分为 和的关系部分为或的关系等等, 这里不再一一列举。
表 3 给出了应用模板名称为汽车销售类和汽车维修类的特定用 户的用户信息传递策略内容和对应的含义:
应用模板名 用户信息传递策略内容 含 义
汽车销售 = { ( 通话次数 > 1 ) } 只要满足通话次数大于一 次的汽车销售联系方的可 传递信息,都会被记录在通 信主体的通信用户描述信 息中
汽车维修 I2 = { ( 通话次数 > 3 ) Π (通 只有满足通话次数大于三 话总时长 > 00:15:00 ) } 次,并且通话总时长超过十 五分钟的汽车维修联系方 的可传递信息,才会被记录 在通信主体的通信用户描 述信息中
表 3
策略池 122, 用于存储各种用户信息传递策略, 并提供给用户信 息生成模块使用。 在策略池 122中, 一个应用模板名称对应一条用户 信息传递策略,用户信息生成模块 120根据原始资源数据所属的应用 模板名称查询并调用策略池 120中对应的用户信息传递策略。
用户信息库 121 , 用于存储通信主体的用户描述信息文件, 包括 但不限于用户的标识 ID、 用户的社会关系属性、 偏好属性。
社会关系属性中记录满足社会关系建立条件的非特定用户和特 定用户及与其的联系权值,联系权值是一个表示用户之间关系度的参 数, 可以根据特定字段经过一定的组合运算得出, 代表通信主体与该 非特定用户或特定用户的联系频繁度或亲密度。 这里, 以其中一种组 合运算为例, 假设联系权值用 S 表示, 特定字段由系统设定, 用 P 表示, 则有式 (2 ):
Figure imgf000016_0001
偏好属性主要由不同应用模板的可传递参数组成,描述了已建立 社会关系的特定用户的特征, 这些特征在满足建立社会关系条件之 后, 传递给通信主体, 用于描述通信主体的通信用户描述信息。 表 4 是一个用户信息记录的例子, 其中用户 1表示通信主体, 在该通信主 体的通信用户描述信息中包括有非特定用户 1、 非特定用户 2、 特定 用户 1和特定用户 2的信息,偏好属性由应用模板 1和应用模板 2的 可传递参数组成, 描述了已建立社会关系的特定用户 1和特定用户 2 的特征。
<用户 1>
<号码 ></号码 >
<社会关系属性 >
<非特定用户 >
<非特定用户 1>
<号码 ></号码 >
<联系权值 ></联系权值 >
</非特定用户 1>
<非特定用户 2>
<号码 ></号码 >
<联系权值 ></联系权值 >
</非特定用户 2>
</非特定用户 >
<特定用户>
<特定用户 1>
<号码 ></号码 >
<名称 ></名称>
<联系权值 ></联系权值〉
</特定用户 1>
<特定用户 2>
<号码 ></号码 >
<名称 ></名称>
<联系权值 ></联系权值 >
</特定用户 2>
</特定用户>
</社会关系属性 >
<偏好属性 >
<应用模板 1>
<模板名称>汽车销售 </模板名称>
<可传递参数 a></可传递参数 a>
<可传递参数 b></可传递参数 b>
</应用模板 1>
<应用; ^板 2>
<模板名称>游艇销售 </模板名称>
<可传递参数 a></可传递参数 a>
<可传递参数 b></可传递参数 b>
</应用模板 2>
</偏好属性>
</用户 1> 表 4
实际应用中,所述的信息标注单元 10和用户信息生成单元 12可 以为两个独立的服务器。
进一步地,如果用户信息生成模块 120从外界获取的通信记录信 息中, 不存在用户信息传递策略中的限制条件中描述的字段, 则本发 明系统还可以包括预处理单元 11 , 用于对通信记录进行预处理, 从 原始通信记录字段中提取预先设定的目标字段组成新记录并存储, 目 标字段至少包括标识通信记录归属者的通信主体标识字段、标识通信 对象的联系方标识字段, 同时还包括按照预设要求对通信记录进行相 应处理并由此产生的附加字段。
预处理单元 11主要包括记录预处理模块 110和新记录库 111。其 中,
记录预处理模块 110, 用于对从外界获取的通信记录信息进行预 处理,从原始通信记录字段中提取预先设定的目标字段组成新记录并 存储, 同时该新记录还包括按照预设要求对通信记录进行相应处理并 由此产生的附加字段。 由目标字段和附加字段组成新的通信记录, 存 入新纪录库 111中。
这里, 以对从外部获得的原始话费清单进行预处理为例进行说 明, 表 5是一种原始话费清单记录, 包括用户号码、 序号、 呼叫发生 地、 主被叫类型、 呼叫类型、 对方号码、 通话日期、 通话时间、 通话 时长、 移动话费和长途话费。 假设预先设定的目标字段为用户号码、 序号、 对方号码、 通话次数和通话总时长, 从表 5可见, 用户号码、 序号和对方号码可以直接从原始话费清单记录中提取,而通话次数和 通话总时长式原始话费清单记录中没有的,可以通过对同类话单记录 进行合并来获得, 即合并联系方标识字段值相同的话单记录, 这里指 对号号码相同的话单记录。 这里的合并也就是相加, 比如要获得对方 号码为 A的通话总时长, 只需将原始话费清单记录中对方号码为 A 的个条记录中的通话时长相加即可。
Figure imgf000019_0001
表 5
新记录库 111 , 用于存储经过预处理的通信记录, 用户信息生成 模块 120从新记录库 111中获取所需的通信记录。记录字段由记录预 处理模块 110为预设的目标字段。 按照上例中, 经过预处理存入新记 录库 111的话单记录如表 6所示:
Figure imgf000019_0002
表 6
表 6中,用户号码字段表示该话单记录是该用户号码对应的通信 用户的话单, 通话次数指的是同类话单条目总数, 通话总时长指同类 话单的通话时长之和。
以上详细描述了本发明生成通信用户描述信息的系统, 下面结合图 1 , 具体描述本发明生成通信用户描述信息的方法, 图 2是本发明提供 的实施例中生成通信用户描述信息的方法的流程图, 该方法可以由预设 定时器控制执行, 或者按照后台管理员下发命令执行, 主要包括以下步 骤:
步骤 200: 预先设置用户信息传递策略。
用户信息传递策略包括针对非特定用户的属性建立条件和特定用 户的属性建立条件, 针对非特定用户的属性建立的条件决定是否将非特 定用户相关信息加入通信主体的通信用户描述信息中, 针对特定用户的 属性建立的条件决定是否将特定用户相关信息加入通信主体的通信用 户描述信息中。 关于信息传递策略, 在描述策略设置模块 123时已详细 介绍, 这里不再重述。
步驟 201 : 获取通信记录信息, 判断通信记录信息中的联系方标识 信息是否存在于生成的用户标注信息中, 若存在, 进入步骤 203; 否则 进入步骤 202。
获取通信记录的方法可以通过很多手段获得, 如从一个专门存储通 信记录的数据库中读取等, 具体实现与本发明无关, 这里不再详述。
步骤 202: 按照预设的用户信息传递策略中的非特定用户的信息传 递策略, 将满足条件的通信记录信息中的联系方标识信息记录到通信主 体的通信用户描述信息中, 之后结束本流程。
联系方标识可以是电话号码等。
步骤 203: 按照预设的用户信息传递策略中的特定用户的信息传递 策略, 将满足条件的通信记录信息中的联系方标识信息, 以及该联系方 标识信息对应的用户标注信息记录到通信主体的通信用户描述信息中。
本步骤中,联系方标识信息对应的用户标注信息,可以是在步骤 201 中判断出通信记录信息中的联系方标识信息存在于生成的用户标注信 息中时, 从生成的用户标注信息中获得的可传递信息, 也可以是在步骤 203 中判断出满足条件后, 依据该联系方标识从生成的用户标注信息中 获得的可传递信息。
所述记录的用户标注信息的方法为:遍历所述通信主体用户的用 户描述信息中预设的偏好属性,判断该偏好属性中是否存在所述用户 标注信息所属的类, 若不存在, 则在该通信主体用户的偏好属性中添 加所述用户标注信息所属的类及其中的可传递参数; 若存在, 则进一 步判断该偏好属性中是否存在所述用户标注信息中的可传递参数,若 存在, 结束; 若不存在, 则将所述用户标注信息中的可传递参数添加 在该偏好属性中。
本步驟中, 用户标注信息的生成方法如图 3所示, 图 3是本发明提 供的实施例中实现信息标注的流程图 , 包括以下步骤:
步骤 300: 提取一条原始资源数据记录, 获取该记录的所属类的类 名称。
这里 , 一条原始资源数据记录指通信记录信息中的一条记录。 步骤 301 : 根据获得的类名称, 调用对应该类名称的应用模板, 并 根据调用的应用模板中包括的字段, 将该记录中对应的字段值记录在该 应用模板中。
本步骤中, 应用模板是预先设置好的。
当出现应用模板中的部分字段在原始资源数据记录中没有对应 字段时, 可以有下面两种处理方式:
方式一, 忽略该字段, 将应用模板中该字段的值设置为空, 该字 段的值可以由企业或管理员通过自服务平台进行手工配置。
方式二,应用模板中的某些字段在原始资源数据记录中没有明确 的对应字段,但是原始资源数据记录中的某些字段内容可能包含有应 用模板中该字段需要的信息, 这里, 将原始资源数据记录中可能包含 有应用模板中该字段需要的信息的某些字段称为模糊字段。 图 4是本 发明提供的实施例中一种记录用户应用模板的方法的流程图, 包括以 下步骤:
步骤 400: 提取应用模板中的字段。
步骤 401 : 原始资源数据记录中是否存在该字段, 若存在, 则进 入步骤 405; 否则, 进入步骤 402。
步骤 402: 原始资源数据记录中是否存在该字段的模糊字段, 若 存在, 则进入步骤 403; 否则, 进入步骤 404。
步骤 403 : 从模糊字段中分析提取关键字段, 并将该关键字段的 值记录在应用模板中, 之后结束。
本步骤中可以采用现有的分词法对模糊字段进行切词分析,提取 有效关键词。 切词分析方法很多, 具体实现属于本领域技术人员公知 技术, 这里不再赘述。
在这种方式下,需要预先在标注模块 100中设置应用模板中某些 字段与其对应的模糊字段的映射表, 这样, 可以通过该映射表查询到 从应用模板中提取的字段对应的模糊字段。 同时, 在这种方式下, 标 注模块 100还进一步包括切词分析功能。
步骤 404: 将应用模板中该字段的值置为空, 之后结束。
步骤 405: 在应用模板中记录该字段的值。
下面结合表 7所示的实例, 给出映射表的一个示例:
Figure imgf000022_0001
表 Ί
假设原始资源数据记录中的一条数据记录了一家汽车销售公司的 注册信息, 该注册信息包括该公司的电话号码、 公司名称、 所属行业、 地址、 公司筒介, 公司简介中有 "宝马" 字样描述。 调用的汽车销售应 用模板上的参数有电话号码、 公司名称、 地址、 品牌, 其中品牌字段有 备选值: 马自达、 宝马、 尼桑、 大众等。 在进行用户信息标注时, 从原 始记录中提取电话号码、 公司名称、 地址三个字段的值写入汽车销售应 用模板中的对应字段, 由于品牌字段在原始资源数据记录中没有对应字 段, 从表 7所示的映射表中得出其模糊字段为公司简介, 从原始资源数 据记录的公司简介字段中进行切词分析, 将 "宝马" 定为品牌字段的值 写入汽车销售应用模板中的品牌字段。
步骤 302: 存储完成记录的应用模板。
自此, 实现了对用户信息的标注, 是该用户称为特定用户。 步骤 303: 判断是否还有原始资源数据库, 若有, 则返回步骤 300; 否则结束。
结合图 1 中对信息标注单元 10的描述, 可知经过标注的特定用户 信息存储在特定用户标注库 103中。
从图 3所示的信息标注流程来看, 一个很重要的过程就是调用应 用模板来对特定用户进行描述。 应用模板基于本体语言设计, 将原始 资源数据写入应用模板之后, 标注模块 100会自动生成该原始资源数 据所描述的特定用户信息的标注信息文件,完成特定用户的属性信息 标注。 下面对比对两个汽车销售公司的信息进行信息标注前后的情 况, 表 8是标注前的汽车销售公司的信息:
Figure imgf000023_0001
表 8中, 加有下划线的黑体字为从原始资源数据记录中的模糊字 段 -业务介绍中切出的关键词汇。
经过标注, 将原始资源数据信息写入应用模板形成表 9所示的标 注信息:
<特定用户 1>
<电话号码>0755-2< 770^^</电话号码>
<模板名称 >/ 车 ^ </模板名称>
<属性参数>
<组 1 : 基本属性>
〈企业名称>深业丰田汽车销售服务有限公司 <l^ 称>
〈地区 >广东省深圳市 <i m >
〈地址 >麻雀岭工业区 9 </地址 >
〈邮编 ></邮编 >
<网址 ></网址 >
</组 1 : 基本属性>
<组2: 扩展属性 >
<品牌 > ;^ </品牌 >
<服务项 >汽车销售、 汽车护理<11务艰 >
</組 2: 扩展属性 >
</属性参数> - </特定用户 1>
<特定用户 2>
<电话号码>0755-82391435</电话号码>
<模板名称>/ 羊^ </模板名称>
<属性参数>
<组 1 : 基本属性>
<企业名琳>飞扬汽车销售服务有限公司 <1 、 称> 〈地区 >广东省深圳 </地区 >
<i >麻雀岭工业区 38 </地址 >
<邮编 ></邮编 >
<网址 ></网址 >
</组 1 : 基本属性>
<组2: 扩展属性 >
<品牌 > </品牌 >
<服务项 >汽车销售、 汽车保险<11务 >
</组 2: 扩展属性 >
</属性参数>
</特定用户 2>
表 9
表 9中, 斜体字为标注出的信息。
进一步地,如果获取的通信记录信息中不存在用户信息传递策略 中的限制条件中描述的字段,则本发明方法还可以包括对通信记录进 行预处理,即从原始通信记录字段中提取预先设定的目标字段组成新 记录并存储, 目标字段至少包括标识通信记录归属者的通信主体标识 字段、 标识通信对象的联系方标识字段, 同时新记录还包括按照预设 要求对通信记录进行相应处理并由此产生的附加字段。
5 目标字段的设定依据通信记录的格式不同而不同, 由管理员设 定。下面结合一个对原始话费清单进行预处理为例进行说明预处理的 方法。
假设某用户 13526843612六月前十天的话费清单如表 10所示:
Figure imgf000025_0001
表 10
10 假设预处理针对原始话费清单的格式,设定的目标字段包括用户 号码、 序号、 对方号码即联系方标识字段, 所述按照要求对通信记录 进行相应处理为合并对方号码相同的话单记录,增加的附加字段包括 通话次数、 通话总时长。 经过合并处理后形成的新记录如表 11所示: 用户号码 序号 对方号码 通话次数 通话总时长 13526843612 1 13343857303 4 01 : 17: 19
13526843612 2 13892983773 1 00: 02: 26
13526843612 3 0755-26710686 2 00: 21 : 26
13526843612 4 0755-82391435 2 00: 09: 46
表 11
假设可以以某种手段获取通话距离的话,也可以将通话距离作为 一个参数加以考虑, 用于判断通信双方的关系度。
以下结合图 1举例说明用户信息生成过程,图 5是实施例的流程图, 包括以下步骤:
步骤 500: 判断是否存在用户通信记录, 若存在, 进入步骤 501 ; 否则结束。
这里假设, 用户信息生成模块 120从新记录库 111中提取了一组预 处理话单, 如表 12所示, 其中用户号码为通信主体标识字段, 对方号 码为联系方标识字段。 因此,本步骤中判断的结果是存在用户通信记录。
Figure imgf000026_0001
表 12
步骤 501 ~步骤 503: 获取一条用户通信记录, 并从该记录中获取 通信主体标识,并判断是否存在该通信主体标识对应的通信主体的信 息, 若存在, 则进入步骤 504; 若不存在, 则创建一条该通信主体的 用户信息记录。
本步骤中, 假设用户信息生成模块 120提取的一条用户通信记录如 表 13所示。
用户号码 序号 对方号码 通话次数 通话总时长 13526843612 1 13343857303 4 01 : 17: 19
表 13
用户信息生成模块 120遍历用户信息库 121 , 判断在用户信息库 121中, 是否记录有用户号码 13526843612, 若未记录, 则创建该用户 的用户信息记录文件 (如表 4 ), 即在用户信息库生成该用户
13526843612的一条空的用户描述信息记录。
步骤 504: 从该用户通信记录中获取联系方标识。
用户信息生成模块 120读取表 13所示通信记录的联系方标识号 码, 即对方号码为 13343857303。
步驟 505: 判断是否存在该联系方的标注信息, 若存在, 则进入 步骤 507; 否则进入步骤 506。
本步驟中, 假设用户信息生成模块 120遍历特定用户标注库 103 , 查询出对方号码 13343857303未经标注。
步骤 506: 调用非特定用户的信息传递策略, 并进入步骤 508。 本步驟假设用户信息生成模块 120从策略池 122调用的非特定用 户的信息传递策略为: I p= { ( 通话次数 > 3 ) Π ( 通话总时长 > 00:30:00 ) }。
步驟 507: 调用特定用户的信息传递策略。
步骤 508: 判断是否满足条件, 若满足, 进入步骤 509; 否则, 返 回步骤 500。
本步骤中, 用户信息生成模块 120根据该非特定用户的信息传递 策略 I p中描述的字段,依次读取表 13所示的用户通信记录中的通话次 数和通话总时长, 判断是否满足 I p中设定的条件。
f艮明显, 本实施例中, 表 13中显示的通话次数为四次, 通话总时 长为一小时十七分十九秒,均满足 I p中设定的条件即通话次数大于三 次且通话总时长大于三十分钟。
步驟 509: 记录联系方的信息, 并返回步骤 500。
将联系方 13343857303添加至 13526843612的用户描述信息中。 进一步地, 可以生成联系方的联系权值并记录。 假设联系权值为 一定时期内与该联系方的通话次数占总通话次数的比例, 如表 12所 示, 在这 4条记录的时段内, 联系方 13343857303的联系权值 s= 4 _ 4
4 + 1 + 2 + 2 9。
以上流程完成了非特定用户 13343857303的信息作为通信主体 13526843621的用户描述信息的生成过程。
按照上述方法, 提取第二条记录, 假设查询出第二条记录中对方 号码 13892983773为非特定用户, 采用图 5所示流程可以得出, 同样调 用非特定用户的信息传递策略, 发现该第二条记录中通话次数为一 次, 通话总时长为两分二十六秒, 不满足 I p中设定的条件, 所以忽略 该话单记录, 即丢弃。
提取第三条记录, 假设查询出第三条记录中对方号码
0755-26710686为特定用户, 联系方 0755-26710686所属类为汽车销售 类, 该联系方的标注信息如表 9所示。 采用图 5所示流程可以得出, 在 步骤 507中, 特定用户标注库 103从标注信息中读取 0755-26710686所 属的应用模板名称, 从策略池 122中调用该应用模板相应的特定用户 的信息传递策略。 假设特定用户的信息传递策略为: 1= { (通话次数 > 1 ) }。 从第三条记录可见, 用户号码 13526843612与对方号码 0755-26710686的通话次数为两次, 满足 I设定的条件即通话次数大于 一次, 因此, 将联系方 0755-26710686的信息添加至通信主体
13526843612的用户描述信息中。 这里需要说明的是, 除了将对方号 码 0755-26710686添加至通信主体 13526843612的用户描述信息中外, 还同时添加对方号码 0755-26710686对应的用户标注信息中的可传递 参数。
进一步地, 生成联系方的联系权值并记录。 4艮设联系权值为一定 时期内与该联系方的通话次数占总通话次数的比例, 如表 12所示, 在 这 4条记录的时段内 , 联系方 0755-26710686的联系权值
s= 2 2
4 +1 + 2 + 2 9 °
由于联系方 0755-26710686是经过标注的特定用户, 所以记录对 方号码 0755-26710686对应的用户标注信息中的可传递参数的方法也 就是在用户描述信息中添加相应的偏好属性。 具体方法为: 首先遍历 该通信主体用户的偏好属性,判断该通信主体用户的偏好属性中是否 有汽车销售类的属性记录, 本实施例中, 假设通信主体用户第一次联 系汽车销售类的特定用户,所以直接在用户偏好属性中添加汽车销售 类记录和相应的可传递参数,该实施例中假设汽车销售模板的可传递 参数为品牌和服务项。
提取第四条记录, 假设联系方 0755-82391435所属类为汽车销售 类, 该联系方的标注信息如表 9所示, 处理流程同第三条记录, 只是 在最后偏好属性的添加过程中, 由于原来已经有汽车销售类的偏好属 性记录, 所以处理这条记录时, 需要判断该偏好属性记录中是否存在 联系方 0755-82391435的标注信息中的可传递参数, 若存在, 则不做 任何操作, 或者将联系方 0755-82391435的标注信息中的可传递参数 添加并覆盖原来的记录; 若不存在, 则将联系方 0755-82391435的标 注信息中的可传递参数添加在该偏好属性中, 以更新偏好属性。
根据图 5所示的流程, 对表 12中的四条记录处理完成后, 最终可 以生成用户的描述信息如表 14所示:
<用户 1>
<号码 >13526843612</号玛 >
<社会关系属性 >
<非特定用户 >
<非特定用户 1>
<号碼 >13343857303</号码 >
<联系权值; >4/ </联系权值〉
</非特定用户 1>
</非特定用户 >
<特定用户 >
<特定用户 1〉
<号码>0755-26710686</号码>
〈名 、 >深业丰田汽车销售服务有限公司<1 称> <联系权值 >2/9</联系权值 >
</特定用户 1>
<特定用户 2>
<号码 >0755-<52^7435</号码 >
<名称>飞扬汽车销售服务有限公司 <1 称>
<联系权值 >2/9</联系权值〉
</特定用户 2>
</特定用户 >
</社会关系属性 >
<偏好属性 >
〈应用模板 1>
<模板名称>^羊^ </模板名称>
<品牌 >丰田、 品牌 >
<1务 >汽车销售、 汽车护理、 汽车保 m > </应用模板 1>
</偏好属性>
</用户 1>
表 14
以上仅以话费清单作为实施例进行描述,本发明方案对于 Emai l、 IM等通信方式同样适用,如将企业 Ema i l与 IM号码进行标注。另外, 本发明方案对于彩铃下载等数据业务的处理也适用,比如可以为各类 彩铃制作相应的本体描述模板, 将服务提供商(SP )提供的各类彩铃 作为特定用户进行标注,然后从用户数据业务的服务记录中分析用户 描述信息。 以上所述, 仅为本发明的较佳实施例而已, 并非用于限定本发明的 保护范围, 凡在本发明的精神和原则之内所做的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。

Claims

权利要求书
1.一种生成通信用户描述信息的系统, 其特征在于, 该系统包括: 用于对特定通信用户的原始信息进行标注的信息标注单元( 10 ), 以及 用于生成通信用户描述信息的用户信息生成单元( 12);
其中, 信息标注单元(10) 包括标注模块(100)、 原始资源数据库 (101)、 应用模板本体库(102)和特定用户标注库(103);
原始资源数据库 (101), 用于记录需要标注的用户的原始信息; 应用模板本体库( 102), 用于针对不同的应用, 建立描述该应用 的类与类属性的应用模板并存储, 所述类与类属性来自一个公知的或 自定义的行业应用领域本体;
标注模块(100), 从原始资源数据库(101) 中获取需要标注的用 户的原始信息, 根据该原始信息所属类, 调用应用模板本体库( 102) 中相应类的应用模板, 将原始信息中对应应用模板的信息值填入该应用 模板中, 实现对该原始信息的标注, 并将经过标注的原始信息存储在特 定用户标注库(103) 中;
用户信息生成单元(12) 包括用户信息生成模块(120)、 用户信息 库( 121 )、 策略池( 122 )和策略设置模块( 123 );
用户信息生成模块(120), 从外界获取通信记录信息, 查询特定用 户标注库(103), 按照策略池(122)中的非特定用户的信息传递策略, 将满足条件的联系方标识信息添加到通信主体的通信用户描述信息 中并存储在用户信息库 (121) 中; 或者按照策略池(122) 中的特定 用户的信息传递策略, 将满足条件的联系方标识信息, 以及该联系方 标识信息对应的存储在特定用户标注库(103) 中的用户标注信息, 添 加到通信主体的通信用户描述信息中并存储在用户信息库( 121 )中; 策略设置模块(123), 用于设置各种用户信息传递策略, 并存储 到策略池 ( 122) 中;
策略池(122), 用于存储各种用户信息传递策略, 并提供给用户 信息生成模块 ( 120)使用;
用户信息库 (121), 用于存储通信主体的用户描述信息文件。
2. 根据权利要求 1 所述的系统, 其特征在于, 所述系统还包括: 用于对通信记录进行预处理的预处理单元 (11), 该预处理单元包括 记录预处理模块 (110) 和新记录库 ( 111), 其中,
记录预处理模块( 110 ), 用于从外界获取的通信记录信息的字段 中提取预先设定的目标字段, 同时按照预设要求对通信记录进行处理 后产生的附加字段, 并存储目标字段和附加字段组成的新记录;
新记录库( 111 ), 用于存储目标字段和附加字段组成新的通信记 录, 并提供给用户信息生成模块 ( 120)使用。
3. 根据权利要求 1或 2所述的系统, 其特征在于, 所述信息标 注单元(10)还包括: 自服务模块(104), 用于提供一个面向用户的 接口, 使用自服务模块 ( 104), 并通过所述标注模块 (100)对特定 用户标注库 (103) 中标注的结果进行更新。
4. 根据权利要求 3所述的系统, 其特征在于, 所述自服务模块 ( 104) 为一操作平台, 或者客户端 /服务器 C/S架构中的客户端, 或 者浏览器 /服务器 B/S架构中的客户端。
5. 根据权利要求 1所述的系统,其特征在于,所述标注模块( 100) 中进一步包括所述应用模板中的字段与其对应的模糊字段的映射表; 所述标注模块 (100) 还包括: 对所述应用模板中的字段对应的 模糊字段进行分析以提取关键字段的切词功能。
6. 根据权利要求 1 所述的系统, 其特征在于, 所述应用模板包 括应用模板名称,及描述该应用模板名称所指示的类的类属性的应用 模板参数; 所述应用模板名称与所述类的名称相同。
7. 根据权利要求 6所述的系统, 其特征在于, 所述应用模板还 包括: 不同类之间的关联关系。
8. 一种生成通信用户描述信息的方法, 其特征在于, 预先设置决 定是否将联系方信息加入通信主体的通信用户描述信息中的用户信息 传递策略, 该方法还包括:
获取通信记录信息 , 判断通信记录信息中的联系方标识信息是否存 在于生成的用户标注信息中,
若不存在, 按照预设的用户信息传递策略中的非特定用户的信息传 递策略, 将满足条件的通信记录信息中的联系方标识信息记录到通信主 体的通信用户描述信息中, 之后结束本流程;
若存在, 按照预设的用户信息传递策略中的特定用户的信息传递策 略, 将满足条件的通信记录信息中的联系方标识信息, 以及该联系方标 识信息对应的用户标注信息记录到通信主体的通信用户描述信息中。
9. 根据权利要求 8所述的方法, 其特征在于, 预先设置针对不同 的应用, 用于描述该应用的类与类属性的本体的应用模板, 所述用户 标注信息的生成方法包括:
提取一条原始资源数据记录, 并获取该记录的所属类的类名称; 根据获得的类名称, 调用对应该类名称的应用模板, 并根据调用的 应用模板中包括的字段, 将该记录中对应的字段值记录在该应用模板 中;
存储完成记录的应用模板。
10. 根据权利要求 9所述的方法, 其特征在于, 若所述应用模板 中的部分字段在原始资源数据记录中不存在, 则所述将原始资源数据记 录中对应的字段值记录在应用模板中的方法为:将应用模板中该字段的 值设置为空。
11. 根据权利要求 9所述的方法, 其特征在于, 若所述应用模板 中的部分字段在原始资源数据记录中不存在, 则所述将原始资源数据记 录中对应的字段值记录在应用模板中的方法为:
预先设置应用模板中的字段与其对应的模糊字段的映射表; 查询映射表,判断所述原始资源数据记录中是否存在所述应用模板 中该字段的模糊字段, 若存在, 从该模糊字段中分析提取关键字段, 并 将该关键字段的值记录在所述应用模板的对应字段中; 否则, 将所述应 用模板中该字段的值设置为空。
12. 根据权利要求 11所述的方法, 其特征在于, 所述分析提取关 键字段的方法为: 切词分析。
13. 根据权利要求 8所述的方法, 其特征在于, 若获取的通信记 录信息中不存在所述用户信息传递策略的条件中描述的字段,则所述 判断通信记录信息中的联系方标识信息是否存在于生成的用户标注信 息中之前, 还包括:
从所述获取的通信记录的字段中提取预先设定的目标字段,以及 按照预设要求对所述通信记录信息进行处理并产生的附加字段,组成 新的通信记录信息并存储。
14. 根据权利要求 8所述的方法, 其特征在于, 若所述通信记录 信息中的联系方标识信息存在于生成的用户标注信息中, 则所述记录用 户标注信息的方法为:
遍历所述通信主体用户的用户描述信息中预设的偏好属性,判断 该偏好属性中是否存在所述用户标注信息所属的类, 若不存在, 则在 该通信主体用户的偏好属性中添加所述用户标注信息所属的类及其中 的可传递参数;
若存在, 则进一步判断该偏好属性中是否存在所述用户标注信息 中的可传递参数, 若存在, 结束; 若不存在, 则将所述用户标注信息 中的可传递参数添加在该偏好属性中。
15. 根据权利要求 8所述的方法, 其特征在于, 该方法进一步包 括:在所述通信用户描述信息中,根据预设的指定字段的组合运算关系, 建立通信主体与所述非特定用户或特定用户的联系频繁度或亲密度。
16. 根据权利要求 9所述的方法, 其特征在于, 所述应用模板是 基于本体语言创建的。
17. 根据权利要求 16所述的方法, 其特征在于, 所述应用模板 包括应用模板名称,及描述该应用模板名称所指示的类的相关类属性 的应用模板参数。
PCT/CN2007/000790 2006-08-07 2007-03-12 Système et procédé de production d'informations descriptives d'un utilisateur de communication WO2008019547A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP07711078A EP2051193A4 (en) 2006-08-07 2007-03-12 SYSTEM AND METHOD FOR PRODUCING DESCRIPTIVE INFORMATION OF A COMMUNICATION USER
CNA2007800017320A CN101361089A (zh) 2006-08-07 2007-03-12 一种生成通信用户描述信息的系统及方法
US12/367,257 US8171055B2 (en) 2006-08-07 2009-02-06 System and method for generating communication subscriber description information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200610104256.2 2006-08-07
CNB2006101042562A CN100558045C (zh) 2006-08-07 2006-08-07 一种生成通信用户描述信息的系统及方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/367,257 Continuation US8171055B2 (en) 2006-08-07 2009-02-06 System and method for generating communication subscriber description information

Publications (1)

Publication Number Publication Date
WO2008019547A1 true WO2008019547A1 (fr) 2008-02-21

Family

ID=39081912

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2007/000790 WO2008019547A1 (fr) 2006-08-07 2007-03-12 Système et procédé de production d'informations descriptives d'un utilisateur de communication

Country Status (4)

Country Link
US (1) US8171055B2 (zh)
EP (1) EP2051193A4 (zh)
CN (2) CN100558045C (zh)
WO (1) WO2008019547A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100558045C (zh) 2006-08-07 2009-11-04 华为技术有限公司 一种生成通信用户描述信息的系统及方法
CN101833708B (zh) * 2010-05-07 2012-08-29 山东中创软件工程股份有限公司 一种生成预警消息的方法和装置
CN102486767B (zh) * 2010-12-02 2015-03-25 北大方正集团有限公司 内容文档的内容标注方法和装置
CN102486926B (zh) * 2010-12-03 2015-04-08 上海博泰悦臻电子设备制造有限公司 个性化音乐媒体信息获取方法及系统
US9626651B2 (en) * 2011-02-04 2017-04-18 International Business Machines Corporation Automated social network introductions for e-meetings
CN102317941A (zh) * 2011-07-30 2012-01-11 华为技术有限公司 信息推荐方法、推荐引擎及网络系统
CN102510358A (zh) * 2011-09-30 2012-06-20 上海量明科技发展有限公司 即时通信中针对交互操作进行积分的方法、客户端及系统
CN102780709A (zh) * 2012-08-21 2012-11-14 广东利为网络科技有限公司 一种权限管理方法和权限管理系统
WO2014078984A1 (en) * 2012-11-20 2014-05-30 Empire Technology Development Llc Degrees of closeness based on communication contents
CN103873630B (zh) * 2014-02-26 2016-08-24 华为技术有限公司 联系人信息管理方法及装置
US11157260B2 (en) 2015-09-18 2021-10-26 ReactiveCore LLC Efficient information storage and retrieval using subgraphs
US9372684B1 (en) * 2015-09-18 2016-06-21 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program via an ontology instance
US9335991B1 (en) 2015-09-18 2016-05-10 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program via an ontology instance
US9864598B2 (en) 2015-09-18 2018-01-09 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program
US9552200B1 (en) 2015-09-18 2017-01-24 ReactiveCore LLC System and method for providing supplemental functionalities to a computer program via an ontology instance
CN105528403B (zh) * 2015-12-02 2020-01-03 小米科技有限责任公司 目标数据识别方法及装置
US10068207B2 (en) 2016-06-17 2018-09-04 Snap-On Incorporated Systems and methods to generate repair orders using a taxonomy and an ontology
CN106201917B (zh) * 2016-07-08 2019-03-15 苏州华元世纪科技发展有限公司 一种数据处理系统和方法
CN108711073B (zh) * 2018-05-15 2022-02-11 中国联合网络通信集团有限公司 用户分析方法、装置及终端
CN108897728B (zh) * 2018-06-27 2023-04-07 平安科技(深圳)有限公司 短信拼接处理方法、装置、计算机设备和存储介质
CN110795426B (zh) * 2018-08-03 2022-07-19 上海小渔数据科技有限公司 数据生成方法、装置和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US20020173971A1 (en) * 2001-03-28 2002-11-21 Stirpe Paul Alan System, method and application of ontology driven inferencing-based personalization systems
US20060106876A1 (en) * 2004-11-12 2006-05-18 Macgregor Robert M Method and apparatus for re-using presentation data across templates in an ontology

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7822188B1 (en) * 1999-04-01 2010-10-26 Callwave, Inc. Methods and apparatus for providing expanded telecommunications service
US7979802B1 (en) * 2000-05-04 2011-07-12 Aol Inc. Providing supplemental contact information corresponding to a referenced individual
US20030229549A1 (en) * 2001-10-17 2003-12-11 Automated Media Services, Inc. System and method for providing for out-of-home advertising utilizing a satellite network
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
AU2003236672A1 (en) 2003-05-16 2004-12-03 Docomo Communications Laboratories Europe Gmbh Personalized service selection
US7698626B2 (en) 2004-06-30 2010-04-13 Google Inc. Enhanced document browsing with automatically generated links to relevant information
CN100558045C (zh) 2006-08-07 2009-11-04 华为技术有限公司 一种生成通信用户描述信息的系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794050A (en) * 1995-01-04 1998-08-11 Intelligent Text Processing, Inc. Natural language understanding system
US20020173971A1 (en) * 2001-03-28 2002-11-21 Stirpe Paul Alan System, method and application of ontology driven inferencing-based personalization systems
US20060106876A1 (en) * 2004-11-12 2006-05-18 Macgregor Robert M Method and apparatus for re-using presentation data across templates in an ontology

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2051193A4 *

Also Published As

Publication number Publication date
EP2051193A1 (en) 2009-04-22
US20090144306A1 (en) 2009-06-04
CN101123532A (zh) 2008-02-13
CN100558045C (zh) 2009-11-04
CN101361089A (zh) 2009-02-04
US8171055B2 (en) 2012-05-01
EP2051193A4 (en) 2009-11-04

Similar Documents

Publication Publication Date Title
WO2008019547A1 (fr) Système et procédé de production d&#39;informations descriptives d&#39;un utilisateur de communication
US10503809B2 (en) System and method of providing a context-aware personalized blogging agent
US7433876B2 (en) Semantic web portal and platform
US7581166B2 (en) System and method of collecting, correlating, and aggregating structured edited content and non-edited content
TWI454099B (zh) 擴充訊息傳送系統與方法
US9160690B2 (en) Systems and methods for event-based profile building
US20080021963A1 (en) Content dissemination using a multi-protocol converter
CN101578617A (zh) 用于为简易文件管理和搜索进行语义注释的方法、装置和计算机程序产品
CN102385615A (zh) 收集和呈现信息
Boehm et al. Introducing iyouit
CN108809809A (zh) 消息发送方法、计算机设备及存储介质
CN112434224A (zh) 一种基于知识图谱的税收优惠政策推荐方法及其系统
US20140091139A1 (en) Semantic note taking system
CN102945239A (zh) 基于位置的交换所搜索
CN1996989B (zh) 一种个人网页系统及其实现方法
US20090150798A1 (en) Method for providing the sympathy of the classified objects having the property and computer readable medium processing the method
WO2013044647A1 (zh) 一种sns网络中推送关联用户的方法及系统
US7370041B2 (en) Information processing method, information processing system, information registration apparatus, information acquisition apparatus, and computer memory product
Foll et al. Classifying multimedia resources using social relationships
KR20110006015A (ko) 인스턴트 메신저와 위키를 연계한 협업문서 생성 기술
Langholm Constructing a Personal Knowledge Graph from Disparate Data Sources
US20040122740A1 (en) Web site map with author awareness
EP2201519A2 (en) System of a knowledge management and networking environment and method for providing advanced functions therefor

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 07711078

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 200780001732.0

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2007711078

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 817/KOLNP/2009

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: RU