WO2015096477A1 - 信息回复方法及装置 - Google Patents

信息回复方法及装置 Download PDF

Info

Publication number
WO2015096477A1
WO2015096477A1 PCT/CN2014/083346 CN2014083346W WO2015096477A1 WO 2015096477 A1 WO2015096477 A1 WO 2015096477A1 CN 2014083346 W CN2014083346 W CN 2014083346W WO 2015096477 A1 WO2015096477 A1 WO 2015096477A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
reply
replied
database
text content
Prior art date
Application number
PCT/CN2014/083346
Other languages
English (en)
French (fr)
Inventor
吉宗诚
张轶博
李航
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2015096477A1 publication Critical patent/WO2015096477A1/zh
Priority to US15/163,337 priority Critical patent/US10230668B2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3335Syntactic pre-processing, e.g. stopword elimination, stemming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present invention relates to the field of communications technologies, and in particular, to an information recovery method and apparatus. Background technique
  • the voice recognition based input technology can greatly improve the speed of information input in a certain scenario, and greatly improves the user experience of the mobile terminal.
  • this technology is limited by the scenes used. In a noisy environment, the accuracy of speech recognition cannot reach a practical level, so it cannot satisfy all users, and in some scenarios where it is not appropriate to speak and urgently need to input information to reply ( For example, you need to reply to a message during a meeting. This type of input technology cannot be applied.
  • the reply message is usually built in the system or pre-defined by the user.
  • the mobile terminal replies according to pre-defined rules (such as meeting, driving, etc.) Set up a good text message.
  • pre-defined rules such as meeting, driving, etc.
  • the technical problem to be solved by the present invention is how to provide an automatic information recovery method and apparatus with a wide range of applicable and adaptable language styles.
  • the present invention provides an information recovery method, including:
  • Receiving information to be replied, the information to be replied includes text content and contact information; searching for a corresponding dialogue style from the database according to the text content and the contact information
  • Pre-processing the text content including word segmentation processing and de-stop word processing;
  • a search is made in a database corresponding to the dialog style information to determine reply information.
  • the conversation style information is dialog style information pre-stored in the mobile terminal; or the dialog style information is generated by the mobile terminal in response to a user operation Dialogue style information.
  • the searching, in the database corresponding to the conversation style information, to determine the reply information, according to the pre-processed data includes:
  • determining the reply information from the information replying dual group includes:
  • the method further includes:
  • the reordering model is trained to learn according to the data in the database according to the first set period.
  • the searching according to the pre-processed data, searching in a database corresponding to the conversation style information To determine the response information, including:
  • Data statistics are performed on the data in the database according to the second setting period, and the statistical information of the words in the information to be replied is obtained, where the word is obtained after performing word segmentation on the text content in the information to be replied. ;
  • the analyzed dialog style information, the preprocessed data, and the original data are stored in the database.
  • the original data includes text content and contact information of the information to be replied, And text content and contact information of the reply message.
  • the present invention provides an information recovery apparatus, including:
  • a receiving unit configured to receive information to be replied, where the information to be replied includes text content and contact information;
  • a searching unit configured to be connected to the receiving unit, configured to search for corresponding dialog style information from a database according to the text content and the contact information;
  • a processing unit configured to be connected to the searching unit, configured to perform pre-processing on the text content, where the pre-processing includes word segmentation processing and de-stop word processing;
  • the determining unit is connected to the processing unit, and configured to perform a lookup in the database corresponding to the conversation style information according to the preprocessed data to determine the reply information.
  • the conversation style information is dialog style information pre-stored in the mobile terminal; or the dialog style information is generated by the mobile terminal in response to a user operation Dialogue style information.
  • the determining unit further includes:
  • a search unit configured to be connected to the processing unit, configured to retrieve, according to the pre-processed data, an alternative information reply binary group from a database corresponding to the dialog style information;
  • the determining unit is further configured to determine the reply information from the information replying dual group.
  • the determining unit further includes:
  • a sorting unit configured to be connected to the retrieving unit, configured to: when a plurality of pieces of the information replying to the dual group are retrieved from the database corresponding to the dialog style information, return a plurality of pieces of the information to the dual group according to the reordering model Reordering;
  • the determining unit is further configured to: determine, from the reordered information reply binary group Respond to the message.
  • the method further includes:
  • a training unit configured to learn to learn the reordering model according to data in the database according to a first set period.
  • the determining unit further includes:
  • a statistical unit configured to perform data statistics on the data in the database according to the second setting period, to obtain statistical information of words in the information to be replied, where the word is used to perform text content in the information to be replied Obtained after word segmentation;
  • the determining unit is further configured to: retrieve, according to the pre-processed data and the statistical information, an alternative information replying binary group from a database corresponding to the dialog style information.
  • a sixth possible implementation manner of the second aspect And configured to perform a dialog style analysis on the to-be-reply information and the reply information, and perform the pre-processing on the reply information;
  • a storage unit configured to be connected to the analysis unit, configured to store the analyzed dialog style information, the pre-processed data, and the original data into the database
  • the original data includes text content and contact information of the information to be replied, and text content and contact information of the reply information.
  • the information replying method of the embodiment of the present invention determines the dialog style by the information to be replied, and searches for the appropriate reply information in the database corresponding to the dialog style according to the pre-processed data for the user to select, which can shorten the time for the user to reply to the information, and enhance the time. user experience.
  • FIG. 1 shows a flow chart of a method for replying information according to an embodiment of the present invention
  • FIG. 2 is a flow chart showing a method for replying information according to another embodiment of the present invention.
  • FIG. 3 is a block diagram showing the structure of an information replying apparatus according to another embodiment of the present invention.
  • FIG. 4 is a block diagram showing the structure of an information replying apparatus according to another embodiment of the present invention.
  • FIG. 5 is a block diagram showing the structure of an information replying apparatus according to another embodiment of the present invention. detailed description
  • FIG. 1 shows a flow chart of a method for replying information according to an embodiment of the present invention.
  • the information reply method may mainly include:
  • Step 100 Receive information to be replied, where the information to be replied includes text content and contact information.
  • Step 110 Search, according to the text content and the contact information, a corresponding dialog style information from a database.
  • a mobile terminal such as a mobile phone, a tablet, etc.
  • a variety of application clients can also be installed on the mobile terminal.
  • WeChat, Weibo, etc. Communicate with others.
  • the text content and the contact information included therein can be read from the information to be replied.
  • the text content is the content in the information to be replied, and the contact information is related information of the contact saved by the user in the mobile terminal, such as a name, a phone number, a grouping information, and the like.
  • a database may be saved, in which the text content generated by the user and other people through the short message or the application client may be saved according to different dialogue styles.
  • the above text content can be saved in the form of a message reply binary group. For example, you can set the conversation style to "respect style for leaders/elders", “casual style for friends/colleagues", and “intimate style for family members”. If the user's leader Wang sends a text message to the user via SMS: help me to fix the ticket, the user replies: Please wait a moment, then help you get it. You can set the information 1 "Help me to book a ticket", reply 1 "Please wait a moment, help you get it done” in the dialogue style database 1 of "Respect style for leaders / elders”.
  • the dialog style information may be dialog style information pre-stored in the mobile terminal, that is, dialog style information pre-stored in the development stage of the mobile terminal; or the dialog style information generated by the mobile terminal in response to the user operation.
  • the user can modify the pre-saved dialog style information according to his own needs, and set the dialogue style information that can better meet the user's own needs, which helps to improve the user experience of the mobile terminal. .
  • the text content and the contact in the information to be replied may be combined.
  • the person information finds the current conversation style information from the database, so that appropriate reply information can be found in the database corresponding to the conversation style information. For example, the user receives the message sent by the friend Liu: Help me to set the ticket, the text content is: Help me to set the ticket, the contact information can include the name: Liu, group: friends, etc., can be combined with text content and contact
  • the person information finds the current conversation style information from the database as "a casual style for friends/colleagues".
  • Step 120 Perform pre-processing on the text content, where the pre-processing includes word segmentation processing and de-stop word processing.
  • the text content in the reply information may be pre-processed, and the pre-processing may include word segmentation processing and de-stop word processing on the text content.
  • word segmentation processing is to split the text content according to words or phrases. For example, "help me set a ticket” can be changed to "help” after word segmentation. I / set / Zhang / ticket ";
  • the text content may include some stop words, such as "", "etc", etc., these stop words have no effect on the results of the query, you can go through Stop word processing removes the word, which reduces the workload of the search process and speeds up the system.
  • Step 130 Perform a lookup in the database corresponding to the dialog style information according to the preprocessed data to determine reply information.
  • the original text content in the information to be returned may be changed into the processed query information for searching in a database corresponding to the conversation style information, thereby determining the reply information that the user can reply, wherein
  • the dialog style information is the dialog style found in step 110.
  • the user saves the contact information and the generated conversation data, and sets different conversation styles, and saves the generated conversation data in the corresponding database according to the conversation style information.
  • the user's conversation data does not need to be uploaded to the remote cloud, which is beneficial to protect the privacy of the user, and the mobile terminal used by the user can directly complete the above steps of the embodiment.
  • the privacy of the user is further protected.
  • the information replying method of the embodiment searches for the dialog style information by using the text content and the contact information of the information to be replied, and uses the pre-processed text content as the query information to perform a search in the database corresponding to the dialog style information. Find the appropriate reply information for the user to select and reply. The user does not need to manually input the reply information, which can shorten the time for the user to reply to the message. Further, through the setting of the dialogue style, the user can be provided with the information to be returned. A style response that enhances the user experience.
  • FIG. 2 shows a flow chart of a method for replying information according to another embodiment of the present invention.
  • the steps in Fig. 2 having the same reference numerals as in Fig. 1 have the same functions, and a detailed description of these steps will be omitted for the sake of brevity.
  • step 130 may further include:
  • Step 200 Search, according to the preprocessed data, an alternative information reply binary group from a database corresponding to the dialog style information;
  • Step 210 Determine the reply information from the information replying dual group.
  • an alternative information reply binary group may be retrieved in a database corresponding to the dialog style information.
  • the retrieved information can be sent back to the user in a binary group, and the user can select a reply as the reply information according to his/her own needs.
  • the user can also make some appropriate adjustments or modifications to the reply information to make the reply information more appropriate.
  • the user's leader Wang sends a text message to the user through a short message: Help me to set a ticket, and according to the text content and contact information of the information to be replied, the dialogue can be determined.
  • the style is "respect style for the leader/elder".
  • the query information can be obtained as "help/me/fix/zhang/ticket”.
  • the following three groups are obtained.
  • the selected information is returned to the two-group and pushed to the user: Information 1 "Help me set a ticket to Hong Kong”, reply 1 "Please wait a moment, I will help you get it”; Information 2 "Help me set a trip to Shanghai Air tickets”, Reply 2 "Okay, what time is it?"; Information 3 "Give me two tickets to Shanghai, thank you!, reply 3 "Okay, right now!.
  • the user can select reply 2 as the reply information according to his own needs, and make appropriate modifications to reply 2 before replying, for example, can be modified as: "OK, please go Where, what time?".
  • step 210 may further include:
  • Step 220 If a plurality of pieces of the information reply binary group are retrieved from a database corresponding to the dialog style information, reordering the plurality of pieces of the information replying dual group according to the reordering model; Step 230, Determining the reply information from the reordered information reply binary group. Specifically, in a possible implementation manner, if a plurality of (for example, 20) information recovery dual groups are retrieved in step 200, if the information is directly sent back to the user by replying to the binary group, the user may not be very Quickly choose the right response message and not provide a good user experience. In the mobile terminal, you can set up a reordering model.
  • the information may be reordered according to the reordering model. After reordering, the information with higher hotspot level may be returned to the second group. The location is pushed to the user, wherein a higher degree of hotspot indicates that the user is more likely to use or has a greater likelihood of replying.
  • the reply information and the retrieved information reply binary group may extract some features, and each feature has a corresponding feature value.
  • Training the learning reordering model is to learn the feature weights of each feature.
  • the sorting value may be used to indicate that a certain information is returned to the binary group and the information to be replied Sex, the larger the sort value is, the stronger the correlation is. The more the information after reordering returns to the position of the binary group, specifically, the sort value can be calculated by the following formula:
  • Score ⁇ (wSg (wSg , reply)) ⁇ w. * f t
  • ( ⁇ 3 ⁇ 4, ⁇ ; ⁇ ) indicates a piece of information retrieved Replying to the two-group
  • w and r ⁇ fy respectively represent the information and reply in the information reply binary group
  • n represents the number of extracted features
  • / represents the feature value of the i-th feature, and is the feature weight of the i-th feature.
  • the n features here can be preset by the developer.
  • the n features can include the following features: 1. The sort value of the initial search; 2. The frequency at which the user uses a certain reply; 3. Wwg, the word shared with ⁇ Number; 4, Sg, degree of similarity; 5, ⁇ wg, the number of words shared with / ⁇ fy; 6, wwg, similarity with ⁇ .
  • the user is sent to the following three pieces of information to reply to the two-group: Information 1 "Help me set a ticket to Hong Kong”, reply 1 "Please wait a moment, I will help you get it”; 2 "Help me set a ticket to Shanghai”, reply 2 "Okay, when will I ask?"; Information 3 "Give me two tickets to Shanghai, thank you!, Reply 3 "Okay, immediately!.
  • Information 1 "Help me set a ticket to Hong Kong”, reply 1 "Please wait a moment, I will help you get it”
  • 2 Help me set a ticket to Shanghai
  • reply 2 "Okay, when will I ask?"
  • Information 3 "Give me two tickets to Shanghai, thank you!, Reply 3 "Okay, immediately!”.
  • the fourth information retrieved in the binary is:
  • the system can reply to the new grouping value of the binary group (msg, reply) in the information to be replied Sg by calculating each retrieved information, and can reply the fourth information to the binary group row.
  • Reply to the message to reply This not only improves the accuracy of the mobile terminal's recommended response, but also reduces the trouble caused by the user's participation in the modification to a certain extent, and further improves the user experience of the mobile terminal.
  • each retrieved information replying to the binary group will have a sorting value, which is called the initial sorting value.
  • This sort value is used by using some simple The statistics of a single are calculated.
  • the initial sorting value can be regarded as one feature (ie, the feature 1 described above), and more features (such as the features 2 to 6 above) can be considered, so the reordering model can use one type. A more accurate calculation yields new sort values for better sorting results.
  • two initial values may be set in the mobile terminal, where the initial value N may indicate that the retrieved information is returned to the binary group.
  • the initial value K may represent the number of duplicates of the information to be selected that is pushed to the user.
  • the user can also modify the initial value according to his own needs to provide a better user experience.
  • the information replying method may further include: learning to learn the reordering model according to the data in the database according to the first setting period.
  • the conversation data generated by the short message and the application client is more and more, and the information recovery binary group saved in the database is also increased, so that the reordering model set in the initial stage is accurate.
  • the degree may be reduced. After reordering according to the reordering model, the information with a higher degree of hotspot may not be returned to the top position of the binary group, which affects the user's choice.
  • a first setting period (for example, 30 days) may be set by the developer, and according to the first setting period, the mobile terminal may automatically according to the dialog data and information in the database. Reply to the information indicated by the two-group to reply to the corresponding relationship, retrain and learn one
  • the new reordering model results in a highly accurate reordering model so that users can get more appropriate response information quickly.
  • the user can modify the first set period according to his own needs. For example, if users rarely use SMS and application clients such as WeChat and Mobile QQ, the resulting dialog data will be small, so the initial reordering model may maintain high accuracy for a long time.
  • the user can delay the first set period, such as from 30 days to 100 days. If users frequently use SMS and application clients such as WeChat and Mobile QQ, the resulting dialog data will be many, so the accuracy of the initial reordering model may drop in a short time, then the user can set the first setting.
  • the cycle is shortened, such as from 30 days to 10 days.
  • the process of training the learning reordering model is started by the user actively modifying the first setting period, and the process of training the learning reordering model is started at a suitable frequency, which can avoid the problem that the system is running slowly due to too frequent training and reordering model, and can avoid the accuracy of the reordering model.
  • the information replying method may further include: performing data statistics on the data in the database according to the second setting period, and obtaining statistical information of the words in the information to be returned, the words And obtained after performing word segmentation processing on the text content in the information to be replied.
  • the step 130 may further include: searching, according to the pre-processed data and the statistical information, an alternative information replying tuple from the database corresponding to the dialog style information.
  • a second setting period (for example, 30 days) may be set by the developer, and according to the second setting period, the mobile terminal may automatically perform data on the dialog data and the preprocessed data in the database. Statistics, to obtain statistical information, so that the information related to the information to be replied can be retrieved from the two-group according to the pre-processed data and statistical information.
  • the user can modify the second set period according to his own needs. For a specific example, reference may be made to the related description of the information reply method in this embodiment.
  • the text content in the reply information is subjected to word segmentation processing. After that, corresponding words can be obtained, for example, the related descriptions in the above embodiments.
  • a plurality of words such as "help/me/fix/sheet/ticket" can be obtained.
  • the data obtained by pre-processing in the database can be statistically analyzed, and the probability that the word appears in a certain sentence or in a document, that is, the word frequency can be obtained. In the process of retrieval, taking into account these statistics, the results of the search can be made more accurate.
  • the information reply method may further include:
  • Step 240 Perform a dialog style analysis on the to-be-reviewed information and the reply information, and perform the pre-processing on the reply information;
  • Step 250 Store the analyzed dialog style information, the pre-processed data, and the original data into the database, where the original data includes text content and contact information of the information to be replied, and the reply The textual content and contact information of the message.
  • the dialog data may be analyzed for the current dialog data, that is, the information to be replied and the reply information, or may be Reply to the information for pre-processing.
  • the dialog style analysis indicates that the dialog style to which the current dialog belongs is determined.
  • the pre-processing refer to the related description in the foregoing embodiment.
  • the analyzed dialog style information, the preprocessed data and the original dialog data are stored in a database corresponding to the dialog style information for use in replying to subsequent information.
  • dialog style of the current conversation data has been determined before the reply information is determined, but the modification of the reply information by the user may change the dialog style of the conversation data.
  • a dialog style analysis can also be performed here so that the dialog data can be saved in the database corresponding to the most appropriate dialog style.
  • the mobile terminal can save the pre-processing result of the information to be replied, and during the information reply process, the information to be replied does not change, and the reply information is not required to be pre-processed at this time.
  • the current conversation style is determined by the text content and the contact information of the information to be replied, and the pre-processed text content is used as the query information, and the search is performed in the database corresponding to the conversation style. Find the appropriate reply information for the user to select and reply. The user does not need to manually input the reply information, which can shorten the time for the user to reply to the message. Further, through the setting of the dialogue style, the user can be provided with the information to be replyed. The style of the reply enhances the user experience.
  • FIG. 3 is a block diagram showing the structure of an information replying apparatus according to an embodiment of the present invention.
  • the information replying apparatus 300 can mainly include:
  • the receiving unit 310 is configured to receive information to be replied, where the information to be replied includes text content and contact information.
  • the searching unit 320 is connected to the receiving unit 310, and is configured to search for corresponding dialog style information from the database according to the text content and the contact information.
  • a mobile terminal such as a mobile phone, a tablet, etc.
  • a variety of application clients can also be installed on the mobile terminal.
  • WeChat, Weibo, etc. Communicate with others.
  • the receiving unit 310 receives the information to be replied sent by another person through the short message or the application client, the text content and the contact information included therein may be read from the information to be replied.
  • the text content is the content in the information to be replied, and the contact information is related information of the contact saved by the user in the mobile terminal, such as a name, a phone number, a grouping information, and the like.
  • a database may be saved, in which the text content generated by the user and other people through the short message or the application client may be saved according to different dialogue styles.
  • the above text content can be saved in the form of a message reply binary group.
  • the conversation style can be set to "respect style for leaders/elders", “casual style for friends/colleagues”, and "intimate style for family members”. If the user's leader Wang sends a text message to the user via SMS: help me to fix the ticket, the user replies: Please wait a moment, and help you get it in a while. You can set the message 1 "Help me to book a ticket", reply 1 "Please wait a moment, and help you get it in a conversation style database 1 of "Respect style for leaders/elders".
  • the searching unit 320 may search the current conversation style information from the database in combination with the text content and the contact information in the information to be replied, so that the database may be in the database corresponding to the conversation style information. Find the right response.
  • the receiving unit 310 receives the information sent by the friend Liu: Help me to set a ticket
  • the text content is: Help me to set a ticket
  • the contact information can include the name: Liu, group: friends, etc.
  • the search unit 320 can Combine the text content and the contact information, and find the current conversation style information from the database as "a casual style for friends/colleagues".
  • dialog style information For a specific example of the dialog style information, refer to the related description in the above embodiments of the present invention, and details are not described herein again.
  • the processing unit 330 is connected to the searching unit 320 for pre-processing the text content, and the pre-processing includes word segmentation processing and de-stop word processing.
  • the processing unit 330 may preprocess the text content in the reply information, and the pre-processing may include performing word segmentation processing and de-stop word processing on the text content.
  • different text content is composed of several words or phrases.
  • the word segmentation process will split the text content according to words or phrases. For example, “help me set a ticket” can be changed to "help / me / after word segmentation” "fix / Zhang / ticket”;
  • the text content may include some stop words, such as "", "etc", etc., these stop words have no effect on the results of the query, you can deactivate Word processing removes the word, which reduces the workload of the search process and speeds up the system.
  • the determining unit 340 is connected to the processing unit 330, and configured to perform a lookup in the database corresponding to the dialog style information according to the preprocessed data to determine reply information.
  • the original text in the information to be replied The content may be changed into the processed query information for the determining unit 340 to perform a search in the database corresponding to the dialog style information, thereby determining the reply information that the user can reply, wherein the dialog style information is the dialog style found by the searching unit 320. information.
  • the user saves the contact information and the generated conversation data, and sets different conversation styles, and saves the generated conversation data in the corresponding database according to the conversation style information. In this way, it is not necessary to upload the user's conversation data to the remote cloud, which is beneficial to protect the privacy of the user.
  • the searching unit searches for the dialog style information according to the text content and the contact information of the information to be replied, and uses the text content preprocessed by the processing unit as the query information, in the database corresponding to the dialog style information.
  • searching you can find the appropriate reply information for the user to select and reply.
  • the user does not need to manually input the reply information, which can shorten the time for the user to reply to the message.
  • the user can be provided with and to reply.
  • the response of the style matches the style, enhancing the user experience.
  • FIG. 4 is a block diagram showing the structure of an information replying apparatus according to another embodiment of the present invention.
  • the components in Fig. 4 having the same components as those in Fig. 3 have the same functions, and a detailed description of these components will be omitted for the sake of brevity.
  • the determining unit 340 may further include:
  • the searching unit 410 is connected to the processing unit 330, and configured to retrieve, according to the pre-processed data, an alternative information replying binary group from a database corresponding to the dialog style information;
  • the determining unit 340 is further configured to determine the reply from the information replying dual group
  • the retrieval unit 410 may retrieve the candidate information in a database corresponding to the dialog style information. Reply to the two-group. Information recovery device 400 can take these The retrieved information reply binary group is pushed to the user, and the user can select one reply as the reply information according to his own needs. At the same time, the user can also make some appropriate adjustments or modifications to the reply information to make the reply information more appropriate. For a specific example, refer to the related description in the information replying method of the above embodiment of the present invention.
  • the determining unit 340 may further include:
  • a sorting unit 420 configured to be connected to the retrieving unit 410, configured to: if a plurality of pieces of the information replying to the dual group are retrieved from the database corresponding to the dialog style information, replying to the plurality of pieces of information according to the reordering model Tuples are reordered;
  • the determining unit 340 is further configured to determine the reply information from the reordered information replying dual group.
  • the information recovery device 400 restores the information to the binary group and directly pushes the information. To the user, the user may not be able to quickly select the appropriate response message and cannot provide a good user experience.
  • a reordering model can be set in the information replying device.
  • the sorting unit 420 may reorder the information reply binary groups according to the reordering model, and after reordering, may restore the information with a higher degree of hotspot to the binary The group is pushed to the user in the front position, wherein a higher degree of hotspot indicates that the user is more likely to use or has a greater chance of replying.
  • a specific example of the reordering model and the reordering process can be referred to the related description in the information replying method of the above embodiment of the present invention.
  • two initial values (such as N, K) may be set, where the initial value N may indicate that the information retrieved by the searching unit 410 returns the number of binary groups, and the initial The value K may indicate the number of duplicates of the information to be selected that the information replying device 400 pushes to the user.
  • the information reply binary group is sent to the user as the information to be selected, and the user is selected, modified, and replied.
  • the user can also modify the initial value according to his own needs to provide a better user experience.
  • the information replying apparatus 400 may further include:
  • the training unit 430 is configured to learn to learn the reordering model according to the data in the database according to the first setting period.
  • the conversation data generated by the short message and the application client is more and more, and the information recovery binary group saved in the database is also increased, so that the reordering model set in the initial stage is accurate.
  • the degree may be lowered.
  • the sorting unit 420 performs reordering according to the reordering model, the information with a higher degree of hotspot may not be returned to the front position of the binary group, which affects the user's selection.
  • a first setting period (such as 30 days) may be set by the developer, and the training unit 430 may follow the dialog data in the database according to the first setting period.
  • the information replying to the information indicated by the two-group group responds to the corresponding relationship, retraining and learning a new reordering model, and obtaining a reordering model with high accuracy, so that the user can quickly obtain more appropriate reply information.
  • the user can modify the first set period according to his own needs. For a specific example, reference may be made to the related description in the information reply method of the above embodiment of the present invention.
  • the process of training the learning reordering model by the training unit 430 is started by the user actively modifying the first setting period, and the problem that the mobile terminal is slow to run due to the too frequent training learning reordering model can be avoided, and the problem can be avoided.
  • Reordering model accuracy reduces the user experience degradation caused by the problem.
  • the information replying apparatus 400 may further include:
  • the statistic unit 440 is configured to perform data statistics on the data in the database according to the second setting period, to obtain statistical information of the words in the information to be replied, where the word is the text content in the information to be replied to Obtained after the word segmentation process;
  • the determining unit 340 is further configured to: retrieve, according to the pre-processed data and the statistical information, an alternative information replying tuple from the database corresponding to the dialog style information.
  • a second setting period (such as 30 days) can be set by the developer, and the statistics unit 440 can follow the second setting period, and the mobile terminal can automatically synchronize the dialog data and the pre-database in the database.
  • the processed data is subjected to data statistics to obtain statistical information, so that the determining unit 340 can retrieve the information related to the information to be replied based on the preprocessed data and the statistical information to reply to the binary group.
  • the user can modify the second set period according to his own needs. For a specific example, reference may be made to the related description of the information reply method in this embodiment.
  • the corresponding word can be obtained, for example, the related description in the above embodiment
  • the "help/me/fix/ ⁇ " can be obtained.
  • the statistical unit 440 can perform data statistics on the pre-processed words in the database according to the second set period, and obtain the probability that the words appear in a certain sentence or in a certain document, that is, the word frequency. In the process of the retrieval by the retrieval unit 410, the results of the retrieval can be made more accurate in consideration of these statistical information.
  • the information replying apparatus 400 may further include:
  • the analyzing unit 450 is connected to the determining unit 340, and configured to perform dialog style analysis on the to-be-reply information and the reply information, and perform the pre-processing on the reply information;
  • the storage unit 460 is connected to the analyzing unit 450, and configured to store the analyzed dialog style information, the pre-processed data and the original data into the database, wherein the original data includes the text of the information to be replied Content and contact information, as well as textual content and contact information of the reply information.
  • the analyzing unit 450 may respond to the current conversation data, that is, the information to be replied and the replies.
  • the information is analyzed in a conversational style, and the reply information can also be preprocessed.
  • the dialog style analysis indicates that the dialog style information of the current dialog data is determined.
  • the storage unit 460 can store the dialog style information, the pre-processed data and the original dialog data obtained by the analysis unit 450 into a database corresponding to the dialog style information for use in replying the subsequent information.
  • the search unit 320 has determined the dialog style information of the current dialog data, but may change the dialog style information of the dialog data after the user modifies the reply information. Considering the deviation of the dialog style information when the search unit 320 finds the dialog style information and the change of the dialog style caused by the user modification, a dialog style analysis is performed again, so that the storage unit 460 can save the dialog data to the database corresponding to the most suitable dialog style information.
  • the mobile terminal can save the pre-processing result of the information to be replied, and during the information reply process, the information to be replied does not change, and the reply information is not required to be pre-processed at this time.
  • the searching unit searches for the dialog style information according to the text content and the contact information of the information to be replied, and uses the text content preprocessed by the processing unit as the query information, in the database corresponding to the dialog style information.
  • searching you can find the appropriate reply information for the user to select and reply.
  • the user does not need to manually input the reply information, which can shorten the time for the user to reply to the message.
  • the user can be provided with and to reply.
  • the response of the style matches the style, enhancing the user experience.
  • FIG. 5 is a block diagram showing the structure of an information replying apparatus according to another embodiment of the present invention.
  • the information replying device 500 may be a host server having a computing capability, a personal computer PC, or a portable computer or mobile terminal that can be carried.
  • the specific embodiments of the present invention do not limit the specific implementation of the computing node.
  • the information replying device 500 includes a processor 510, a communications interface 520, a memory 530, and a bus 540.
  • the processor 510, the communication interface 520, and the memory 530 complete communication with each other through the bus 540.
  • Communication interface 520 is for communicating with network devices, such as virtual machine management centers, shared storage, and the like.
  • the processor 510 is for executing a program.
  • the processor 510 may be a central processing unit CPU, or an Application Specific Integrated Circuit (ASIC), or one or more integrated circuits configured to implement embodiments of the present invention.
  • ASIC Application Specific Integrated Circuit
  • the memory 530 is used to store files.
  • Memory 530 may include high speed RAM memory and may also include non-volatile memory, such as at least one disk memory.
  • Memory 530 can also be a memory array.
  • Memory 530 may also be partitioned, and the blocks may be combined into a virtual volume according to certain rules.
  • the above program may be a program code including computer operating instructions. This program can be used to:
  • Receiving information to be replied, the information to be replied includes text content and contact information; searching for a corresponding dialogue style from the database according to the text content and the contact information
  • Pre-processing the text content including word segmentation processing and de-stop word processing;
  • a search is made in a database corresponding to the dialog style information to determine reply information.
  • the searching according to the text content in the dialogue style information corresponding database to determine the reply information includes:
  • determining the reply information from the information replying dual group includes:
  • the method further includes:
  • the reordering model is trained to learn according to the data in the database according to the first set period.
  • the searching, in the database corresponding to the dialog style information, according to the text content, to determine the reply information further includes:
  • Data statistics are performed on the data in the database according to the second setting period, and the statistical information of the words in the information to be replied is obtained, where the word is obtained after performing word segmentation on the text content in the information to be replied. ;
  • the method further includes:
  • the analyzed dialog style information, the preprocessed data, and the original data are stored in the database.
  • the original data includes text content and contact information of the information to be replied, and text content and contact information of the reply information.
  • the function is implemented in the form of computer software and sold or used as a stand-alone product, it may be considered to some extent that all or part of the technical solution of the present invention (for example, a part contributing to the prior art) is It is embodied in the form of computer software products.
  • the computer software product is typically stored in a computer readable non-volatile storage medium, including instructions for causing a computer device (which may be a personal computer, server, or network device, etc.) to perform all of the methods of various embodiments of the present invention. Or part of the step.
  • the foregoing storage medium includes various media that can store program codes, such as a USB flash drive, a removable hard disk, a Read-Only Memory (ROM), a Random Access Memory (RAM), a magnetic disk, or an optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种信息回复方法及装置,其中,该信息回复方法包括:接收待回复信息,待回复信息包括文本内容和联系人信息;根据文本内容和联系人信息,从数据库中查找对应的对话风格信息;对文本内容进行预处理,预处理包括分词处理和去停用词处理;根据预处理后的数据,在对话风格信息对应的数据库中进行查找,以确定回复信息。通过待回复信息确定对话风格,并根据预处理后的数据在该对话风格对应的数据库中查找合适的回复信息供用户选择,可以缩短用户回复信息的时间,增强用户体验。

Description

技术领域
本发明涉及通信技术领域, 尤其涉及一种信息回复方法及装置。 背景技术
近年来, 随着移动终端 (例如智能手机、 平板电脑等) 的发展与普及, 人与人之间的文字信息交互方式也逐渐从传统短信服务向微信、微博、飞信、 移动 QQ等新兴应用转移。 在移动终端中, 传统短信服务的信息和用户自己 安装的客户端 (例如微信、 微博、 飞信、 移动 QQ等) 的信息都需要用户的 参与进行回复, 然而, 进行信息回复的最大问题在于信息的输入非常慢。 作 为移动终端生产商, 为用户提供出色的文字信息交互的操作体验是移动终端 生产商赢得用户的重要途径, 而在移动终端设计一个高效而实用的信息自动 回复系统将会大大提高移动终端的用户体验。
在现有技术中,基于语音识别的输入技术在一定场景下可以很大的提升 信息输入的速度, 极大地提高了移动终端的用户体验。 但是该技术受限于使 用的场景, 在吵杂的环境下语音识别的准确率不能达到实用水平, 因此并不 能让所有用户满意, 并且在某些不宜讲话而急需输入信息进行回复的场景下 (例如在开会中需要回复信息) 不能应用此种输入技术。
基于预先设定好的规则或模式的输入技术, 回复的短信通常是系统内置 或者用户预先定义的, 移动终端接收到待回复的短信后, 根据预先定义好的 规则 (例如开会、 开车等) 回复设置好的短信。 这种输入技术能够满足用户 的部分需求, 但不能回复所有的短信, 因为预先设定好的规则或模式比较固 定, 而且很有限, 因此很少被人们使用; 此外, 这种输入技术无法适用于用 综上所述, 现有的信息回复方法存在适用范围有限、 语言风格单一等缺 陷。 发明内容
技术问题
有鉴于此, 本发明要解决的技术问题是, 如何提供一种适用范围广、 可 以适应性调整语言风格的信息自动回复方法及装置。
解决方案
为了解决上述技术问题,在第一方面,本发明提供了一种信息回复方法, 包括:
接收待回复信息, 所述待回复信息包括文本内容和联系人信息; 根据所述文本内容和所述联系人信息,从数据库中査找对应的对话风格
I Ή自、 .,
对所述文本内容进行预处理, 所述预处理包括分词处理和去停用词处 理;
根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行査 找, 以确定回复信息。
结合第一方面, 在第一方面的第一种可能的实现方式中, 所述对话风格 信息为移动终端中预先保存的对话风格信息; 或所述对话风格信息为所述移 动终端响应用户操作生成的对话风格信息。
结合第一方面, 在第一方面的第二种可能的实现方式中, 所述根据所述 预处理后的数据, 在所述对话风格信息对应的数据库中进行査找, 以确定回 复信息, 包括:
根据所述预处理后的数据, 从所述对话风格信息对应的数据库检索出备 选的信息回复二元组; 从所述信息回复二元组中确定所述回复信息。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实 现方式中, 从所述信息回复二元组中确定所述回复信息, 包括:
如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二 元组, 则根据重排序模型对多条所述信息回复二元组进行重排序;
从所述重排序后的信息回复二元组中确定所述回复信息。
结合第一方面的第三种可能的实现方式,在第一方面的第四种可能的实 现方式中, 还包括:
按照第一设定周期, 根据所述数据库中的数据, 训练学习所述重排序模 型。
结合第一方面的第二种可能的实现方式,在第一方面的第五种可能的实 现方式中, 所述根据所述预处理后的数据, 在所述对话风格信息对应的数据 库中进行査找, 以确定回复信息, 还包括:
按照第二设定周期, 对所述数据库中的数据进行数据统计, 得到所述待 回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进 行分词处理之后得到的;
根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的 数据库检索出备选的信息回复二元组。
结合第一方面以及第一方面的第一种至第五种可能的实现方式中的任 一种可能的实现方式, 在第一方面的第六种可能的实现方式中, 还包括: 对所述待回复信息和所述回复信息进行对话风格分析, 并对所述回复信 息进行所述预处理;
将分析后的对话风格信息、 预处理后的数据和原始数据存入所述数据 库,
其中, 所述原始数据包括所述待回复信息的文本内容和联系人信息, 以 及所述回复信息的文本内容和联系人信息。
在第二方面, 本发明提供了一种信息回复装置, 包括:
接收单元, 用于接收待回复信息, 所述待回复信息包括文本内容和联系 人信息;
査找单元, 与所述接收单元连接, 用于根据所述文本内容和所述联系人 信息, 从数据库中査找对应的对话风格信息;
处理单元, 与所述査找单元连接, 用于对所述文本内容进行预处理, 所 述预处理包括分词处理和去停用词处理;
确定单元, 与所述处理单元连接, 用于根据所述预处理后的数据, 在所 述对话风格信息对应的数据库中进行査找, 以确定回复信息。
结合第二方面, 在第二方面的第一种可能的实现方式中, 所述对话风格 信息为移动终端中预先保存的对话风格信息; 或所述对话风格信息为所述移 动终端响应用户操作生成的对话风格信息。
结合第二方面, 在第二方面的第二种可能的实现方式中, 所述确定单元 还包括:
检索单元, 与所述处理单元连接, 用于根据所述预处理后的数据, 从所 述对话风格信息对应的数据库检索出备选的信息回复二元组;
所述确定单元还被配置为, 从所述信息回复二元组中确定所述回复信 息。
结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实 现方式中, 所述确定单元还包括:
排序单元, 与所述检索单元连接, 用于如果从所述对话风格信息对应的 数据库中检索出多条所述信息回复二元组, 则根据重排序模型对多条所述信 息回复二元组进行重排序;
所述确定单元还被配置为, 从所述重排序后的信息回复二元组中确定所 述回复信息。
结合第二方面的第三种可能的实现方式,在第二方面的第四种可能的实 现方式中, 还包括:
训练单元, 用于按照第一设定周期, 根据所述数据库中的数据, 训练学 习所述重排序模型。
结合第二方面的第二种可能的实现方式,在第二方面的第五种可能的实 现方式中, 所述确定单元还包括:
统计单元, 用于按照第二设定周期, 对所述数据库中的数据进行数据统 计, 得到所述待回复信息中单词的统计信息, 所述单词为对所述待回复信息 中的文本内容进行分词处理之后得到的;
所述确定单元还被配置为, 根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的数据库检索出备选的信息回复二元组。
结合第二方面以及第二方面的第一种至第五种可能的实现方式中的任 一种可能的实现方式, 在第二方面的第六种可能的实现方式中, 还包括: 分析单元, 用于对所述待回复信息和所述回复信息进行对话风格分析, 并对所述回复信息进行所述预处理;
存储单元, 与所述分析单元连接, 用于将分析后的对话风格信息、 预处 理后的数据和原始数据存入所述数据库,
其中, 所述原始数据包括所述待回复信息的文本内容和联系人信息, 以 及所述回复信息的文本内容和联系人信息。
有益效果
本发明实施例的信息回复方法, 通过待回复信息确定对话风格, 并根据 预处理后的数据在该对话风格对应的数据库中査找合适的回复信息供用户 选择, 可以缩短用户回复信息的时间, 增强用户体验。
根据下面参考附图对示例性实施例的详细说明, 本发明的其它特征及方 面将变得清楚。 附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了 本发明的示例性实施例、 特征和方面, 并且用于解释本发明的原理。
图 1示出根据本发明一实施例的信息回复方法的流程图;
图 2示出根据本发明另一实施例的信息回复方法的流程图;
图 3示出根据本发明另一实施例的信息回复装置的结构框图;
图 4示出根据本发明另一实施例的信息回复装置的结构框图;
图 5示出根据本发明另一实施例的信息回复装置的结构框图。 具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、 特征和方面。 附 图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施 例的各种方面, 但是除非特别指出, 不必按比例绘制附图。
在这里专用的词"示例性 "意为 "用作例子、 实施例或说明性"。 这里作为 "示例性"所说明的任何实施例不必解释为优于或好于其它实施例。
另外, 为了更好的说明本发明, 在下文的具体实施方式中给出了众多的 具体细节。 本领域技术人员应当理解, 没有某些具体细节, 本发明同样可以 实施。 在另外一些实例中, 对于本领域技术人员熟知的方法、 手段、 元件和 电路未作详细描述, 以便于凸显本发明的主旨。
图 1示出根据本发明一实施例的信息回复方法的流程图。 如图 1所示, 该 信息回复方法主要可以包括:
歩骤 100、 接收待回复信息, 所述待回复信息包括文本内容和联系人信 息; 歩骤 110、 根据所述文本内容和所述联系人信息, 从数据库中査找对应 的对话风格信息。
具体地, 在用户使用移动终端 (例如手机、 平板电脑等) 的时候, 除了 可以通过短信与他人进行沟通交流之外, 还可以通过在移动终端安装各种各 样的应用客户端 (例如移动 QQ、 微信、 微博等) 与他人进行沟通交流。 在 用户接收到他人通过短信或者应用客户端发送的待回复信息之后, 可以从待 回复信息中读取到其中包括的文本内容以及联系人信息。 其中, 文本内容即 为待回复信息中的内容, 联系人信息为用户在移动终端中保存的该联系人的 相关信息, 例如姓名、 电话号码、 分组信息等。
在一种可能的实现方式中, 在移动终端中, 可以保存一个数据库, 在该 数据库中可以按照不同的对话风格保存用户与他人通过短信或者应用客户 端进行沟通的过程中产生的文本内容。 在该数据库中, 上述文本内容可以以 信息回复二元组的形式进行保存。 例如, 可以将对话风格设置为 "对领导 / 长辈的尊敬风格"、 "对朋友 /同事的随意风格"和 "对家人的亲密风格"等。 若用户的领导王某通过短信给用户发来一条短信:帮我定张机票,用户回复: 请您稍等, 一会儿帮您搞定。 可以将信息 1 "帮我定张机票", 回复 1 "请您 稍等, 一会儿帮您搞定"保存在 "对领导 /长辈的尊敬风格"的对话风格数据 库 1中。
需要说明的是, 上述对话风格信息可以为移动终端中预先保存的对话风 格信息, 即在移动终端的开发阶段预先保存的对话风格信息; 也可以为所述 移动终端响应用户操作生成的对话风格信息, 即在用户使用移动终端的过程 中, 可以根据自身的需求对预先保存的对话风格信息进行修改, 并设置可以 较好满足用户自身需求的对话风格信息, 有助于提高该移动终端的用户体 验。
在用户接收到待回复信息时, 可以结合待回复信息中的文本内容和联系 人信息, 从数据库中査找当前的对话风格信息, 以使得可以在该对话风格信 息对应的数据库中査找到合适的回复信息。 例如, 用户接收到好友刘某发送 来的信息: 帮我定张机票, 文本内容为: 帮我定张机票, 联系人信息可以包 括姓名: 刘某、 分组: 好友等, 可以结合文本内容和联系人信息从数据库中 査找当前的对话风格信息为 "对朋友 /同事的随意风格"。
歩骤 120、 对所述文本内容进行预处理, 所述预处理包括分词处理和去 停用词处理。
具体地, 在査找到当前的对话风格信息之后, 可以对待回复信息中的文 本内容进行预处理, 该预处理可以包括对文本内容进行分词处理和去停用词 处理。 其中, 不同的文本内容都是由若干个单词或词组组成的, 分词处理即 为将文本内容按照单词或词组进行拆分, 例如 "帮我定张机票"通过分词处 理之后可以变为 "帮 /我 /定 /张 /机票"; 此外, 在文本内容中可能会包括一些 停用词, 如 "的"、 "等"等词, 这些停用词对査询的结果没有影响, 则可以 通过去停用词处理将这个词去掉, 这样可以减少査找过程的工作量, 加快系 统的运行速度。
歩骤 130、 根据所述预处理后的数据, 在所述对话风格信息对应的数据 库中进行査找, 以确定回复信息。
具体地, 经过预处理之后, 待回复信息中的原始文本内容可以变为处理 后的査询信息, 以用于在对话风格信息对应的数据库中进行査找, 从而确定 用户可以回复的回复信息, 其中对话风格信息为歩骤 110査找到的对话风格
I Ft自、。
在移动终端中, 充分利用用户保存的联系人信息及产生的对话数据, 设 定不同的对话风格, 并根据对话风格信息将产生的对话数据分别保存在对应 的数据库中。 这样, 不需要将用户的对话数据上传至远程云端, 有利于保护 用户的隐私, 并且用户使用的移动终端可以直接完成本实施例的上述歩骤, 进一歩地保护了用户的隐私。
本实施例的信息回复方法,通过待回复信息的文本内容和联系人信息査 找对话风格信息, 并以预处理后的文本内容作为査询信息, 在该对话风格信 息对应的数据库中进行査找, 可以査找到合适的回复信息供用户选择并进行 回复, 用户不需要手动输入回复信息, 可以缩短用户回复信息的时间, 进一 歩地, 通过对话风格的设置, 可以向用户提供与待回复信息相匹配的风格的 回复, 增强了用户体验。
图 2示出根据本发明另一实施例的信息回复方法的流程图。 图 2中标号与 图 1相同的歩骤具有相同的功能, 为简明起见, 省略对这些歩骤的详细说明。
如图 2所示, 图 2所示的信息回复方法与图 1所示的信息回复方法主要区 别在于, 歩骤 130还可以包括:
歩骤 200、 根据所述预处理后的数据, 从所述对话风格信息对应的数据 库检索出备选的信息回复二元组;
歩骤 210、 从所述信息回复二元组中确定所述回复信息。
具体地, 在一种可能的实现方式中, 根据确定的对话风格信息和预处理 后的数据,可以在该对话风格信息对应的数据库中检索出备选的信息回复二 元组。 可以将这些检索到的信息回复二元组推送给用户, 用户根据自身的需 求, 可以从中选择一条回复作为回复信息。 同时, 用户还可以对该回复信息 作一些适当的调整或者修改, 以使得回复的信息更加恰当。 例如, 参见上一 实施例中信息回复方法的相关描述,用户的领导王某通过短信给用户发来一 条短信: 帮我定张机票, 根据待回复信息的文本内容和联系人信息, 可以确 定对话风格为 "对领导 /长辈的尊敬风格", 经过预处理可以得到査询信息为 "帮 /我 /定 /张 /机票", 在该对话风格信息对应的数据库中检索后, 得到如下 三组备选的信息回复二元组并推送给用户: 信息 1 "帮我定张去香港的机 票", 回复 1 "请您稍等,一会帮您搞定";信息 2 "帮我定张去上海的机票", 回复 2 "好的, 请问定什么时候的? "; 信息 3 "给我定两张去上海的机票 吧, 谢谢!", 回复 3 "好的, 马上!"。 在上述检索到的信息回复二元组中, 用户可以根据自身的需求选择回复 2作为回复信息, 并对在回复之前对回复 2 进行适当的修改, 如可以修改为: "好的, 请问定去哪里、 什么时间的? "。
进一歩地, 歩骤 210还可以包括:
歩骤 220、 如果从所述对话风格信息对应的数据库中检索出多条所述信 息回复二元组, 则根据重排序模型对多条所述信息回复二元组进行重排序; 歩骤 230、 从所述重排序后的信息回复二元组中确定所述回复信息。 具体地, 在一种可能的实现方式中, 如果歩骤 200检索到多条(如 20条) 信息回复二元组, 这时如果将这些信息回复二元组直接推送给用户, 用户可 能无法很快地选择出合适的回复信息, 无法提供很好的用户体验。 在移动终 端中, 可以设置一种重排序模型。 在检索出多条信息回复二元组之后, 可以 根据该重排序模型对这些信息回复二元组进行重排序, 重排序之后, 可以将 热点程度较高的信息回复二元组排在靠前的位置推送给用户, 其中热点程度 较高表示用户使用较为频繁或者回复的可能性较大。
在一种可能的实现方式中, 可以对待回复信息和检索出的信息回复二元 组抽取一些特征, 每个特征都有对应的特征值。 训练学习重排序模型就是学 习每个特征的特征权重。根据重排序模型对检索出的信息回复二元组进行重 排序, 需要计算每一条信息回复二元组的排序值, 该排序值可以用来指示某 一条信息回复二元组与待回复信息的相关性, 排序值越大表明相关性越强, 重排序后的该信息回复二元组的位置越靠前, 具体地, 排序值可以由以下公 式计算得到:
n
score ^ (wSg (wSg , reply)) =∑w. * ft 其中, 表示待回复信息, (^¾,^;^ν)表示检索出的一条信息 回复二元组, w 、 r^fy分别表示信息回复二元组中的信息和回复, n表 示抽取的特征数目, /;表示第 i个特征的特征值, 为第 i个特征的特征权重。
这里的 n个特征可以由开发者预先设定, 这 n个特征可以包括如下特征: 1、 初始检索的排序值; 2、 用户使用某一回复的频率; 3、 wwg,与^^共 有单词的数目; 4、 Sg,与 的相似度; 5、 ^wg,与 / ^fy共有单 词的数目; 6、 wwg,与^^ 的相似度。
举例而言, 按照设置的 K=3推送给用户如下三条信息回复二元组: 信息 1 "帮我定张去香港的机票", 回复 1 "请您稍等,一会帮您搞定"; 信息 2 "帮我定张去上海的机票",回复 2 "好的,请问定什么时候的? "; 信息 3 "给我定两张去上海的机票吧, 谢谢!", 回复 3 "好的, 马上!"。 假设检索出的第四条信息回复二元组是:
信息 4 "记得帮我定张机票, 谢谢!", 回复 4 "好的, 请问定去哪里、 什 么时间的? "。
在设置 Κ=3即推送给用户三条信息回复二元组的情况下, 用户并没有看 到第四条信息回复二元组。所以用户可以选择第二条并进行修改得到"好的, 请问定去哪里、 什么时间的? "进行回复。
若使用了重排序模型, 系统可以通过计算每条检索出的信息回复二元组 ( msg , reply)在待回复信息 Sg,下的新的排序值, 可以将第四条信息回 复二元组排到前三位(甚至第一位),这样用户便可以在按照设置的 K=3推送 给用户的三条信息回复二元组中直接选择 "好的, 请问定去哪里、 什么时间 的? "作为回复信息进行回复。这样不但可以提高移动终端推荐回复的精度, 而且在一定程度上减少了用户参与修改带来的麻烦,进一歩提升该移动终端 的用户体验。
需要说明的是, 在没有使用重排序模型的时候, 每个检索出的信息回复 二元组都会有一个排序值, 称为初始排序值。 这个排序值是通过使用一些简 单的统计信息计算得到。 在重排序模型中, 可以将该初始排序值作为一个特 征(即上述的特征 1 ), 同时还可以考虑更多的特征(如上述的特征 2〜特征 6), 因此重排序模型可以使用一种更精确的计算方法得到新的排序值, 从而取得 更好的排序结果。
在一种可能的实现方式中, 上述实施例的信息回复方法中, 在移动终端 中可以设置两个初始值 (如 N, K) , 其中初始值 N可以表示检索出的信息回 复二元组个数, 初始值 K可以表示推送给用户的待选择的信息回复二元组个 数。 例如, 在移动终端中, 可以设置初始值 N=20, K=3, 则在对话风格信息 对应的数据库中检索时,需要检索出 Ν=20条备选的信息回复二元组。对这些 信息回复二元组根据重排序模型进行重排序之后, 选择前 Κ=3条信息回复二 元组作为待选择的信息回复二元组推送给用户, 以供用户选择、 修改以及回 复。
需要说明的是, 除了开发者可以设置这两个初始值之外, 在用户使用移 动终端的过程中, 用户还可以根据自身的需求对初始值进行修改, 以提供更 好的用户体验。
在一种可能的实现方式中, 该信息回复方法还可以包括: 按照第一设定 周期, 根据所述数据库中的数据, 训练学习所述重排序模型。
具体地, 随着用户使用移动终端, 由短信和应用客户端产生的对话数据 越来越多, 在数据库中保存的信息回复二元组也会随之增多, 这样初始阶段 设置的重排序模型准确度可能会降低, 根据重排序模型进行重排序之后, 可 能不会将热点程度较高的信息回复二元组排在靠前的位置, 影响用户的选 择。
在一种可能的实现方式中, 在移动终端中, 可以由开发者设置一个第一 设定周期 (如 30天), 按照第一设定周期, 移动终端可以自动根据数据库中 的对话数据、 信息回复二元组指示的信息回复对应关系, 重新训练学习一个 新的重排序模型, 得到准确度高的重排序模型, 以使得用户可以快速的得到 更为恰当的回复信息。 在另一种可能的实现方式中, 用户可以根据自身的需 求对第一设定周期进行修改。例如,若用户很少使用短信以及微信、移动 QQ 等应用客户端, 由此产生的对话数据会很少, 这样初始的重排序模型可能在 很长的时间内都可以保持较高的准确度, 那么用户可以将第一设定周期延 迟, 如由 30天改为 100天。 若用户经常使用短信以及微信、 移动 QQ等应用客 户端, 由此产生的对话数据会很多, 这样初始的重排序模型的准确度可能在 很短的时间内下降,那么用户可以将第一设定周期缩短,如由 30天改为 10天。
通过用户主动修改第一设定周期, 以较合适的频率启动训练学习重排序 模型的过程, 可以避免过于频繁的训练学习重排序模型导致的系统运行缓慢 的问题, 还可以避免由于重排序模型准确度降低引起的用户体验下降的问 题。
在一种可能的实现方式中, 该信息回复方法还可以包括: 按照第二设定 周期, 对所述数据库中的数据进行数据统计, 得到所述待回复信息中单词的 统计信息,所述单词为对所述待回复信息中的文本内容进行分词处理之后得 到的。
歩骤 130还可以包括: 根据所述预处理后的数据和所述统计信息, 从所 述对话风格信息对应的数据库检索出备选的信息回复二元组。
具体地,在移动终端中,可以由开发者设置一个第二设定周期(如 30天), 按照第二设定周期,移动终端可以自动对数据库中的对话数据和预处理后的 数据进行数据统计, 以得到统计信息, 以使得可以根据预处理后的数据和统 计信息, 检索与待回复信息相关的信息回复二元组。 在另一种可能的实现方 式中, 用户可以根据自身的需求对第二设定周期进行修改。 具体示例可以参 见本实施例中信息回复方法的相关描述。
在一种可能的实现方式中,对待回复信息中的文本内容进行分词处理之 后, 可以得到相应的单词, 例如上述实施例中的相关描述, 预处理后, 可以 得到 "帮 /我 /定 /张 /机票"等多个单词。 按照第二设定周期, 可以对数据库中 预处理后得到的单词进行数据统计, 可以得到单词在某个句子中或者某个文 档中出现的概率即词频。 在检索的过程中, 考虑到这些统计信息, 可以使检 索的结果更加精确。
在一种可能的实现方式中, 在歩骤 130之后, 该信息回复方法还可以包 括:
歩骤 240、 对所述待回复信息和所述回复信息进行对话风格分析, 并对 所述回复信息进行所述预处理;
歩骤 250、 将分析后的对话风格信息、 预处理后的数据和原始数据存入 所述数据库, 其中, 所述原始数据包括所述待回复信息的文本内容和联系人 信息, 以及所述回复信息的文本内容和联系人信息。
具体地, 通过本实施例以及上述实施例的歩骤, 接收到待回复信息、 确 定回复信息并进行回复之后, 可以对当前的对话数据即待回复信息和回复信 息进行对话风格分析, 也可以对回复信息进行预处理。 其中, 对话风格分析 表示确定当前对话属于的对话风格, 预处理的具体示例可以参见上述实施例 中的相关描述。 将分析后的对话风格信息、 预处理后的数据和原始对话数据 存入对话风格信息对应的数据库中, 以用于后续信息的回复。
需要说明的是, 在确定回复信息之前, 已经确定了当前对话数据的对话 风格, 但是经过用户对回复信息的修改可能会改变对话数据的对话风格。 考 虑到确定对话风格时的偏差和用户修改引起的对话风格变化,在此还可以进 行一次对话风格分析, 以使得可以将对话数据保存到最合适的对话风格对应 的数据库中。 而移动终端可以保存对待回复信息的预处理结果, 并且在信息 回复过程中, 待回复信息没有发生变化, 此时不需要再对待回复信息进行预 处理。 本实施例的信息回复方法,通过待回复信息的文本内容和联系人信息确 定当前的对话风格, 并以预处理后的文本内容作为査询信息, 在该对话风格 对应的数据库中进行査找,可以査找到合适的回复信息供用户选择并进行回 复, 用户不需要完全手动输入回复信息, 可以缩短用户回复信息的时间, 进 一歩地, 通过对话风格的设置, 可以向用户提供与待回复信息相匹配的风格 的回复, 增强了用户体验。
图 3示出根据本发明一实施例的信息回复装置的结构框图。 如图 3所示, 该信息回复装置 300主要可以包括:
接收单元 310, 用于接收待回复信息, 所述待回复信息包括文本内容和 联系人信息;
査找单元 320, 与所述接收单元 310连接, 用于根据所述文本内容和所述 联系人信息, 从数据库中査找对应的对话风格信息。
具体地, 在用户使用移动终端 (例如手机、 平板电脑等) 的时候, 除了 可以通过短信与他人进行沟通交流之外, 还可以通过在移动终端安装各种各 样的应用客户端 (例如移动 QQ、 微信、 微博等) 与他人进行沟通交流。 在 接收单元 310接收到他人通过短信或者应用客户端发送的待回复信息之后, 可以从待回复信息中读取到其中包括的文本内容以及联系人信息。 其中, 文 本内容即为待回复信息中的内容,联系人信息为用户在移动终端中保存的该 联系人的相关信息, 例如姓名、 电话号码、 分组信息等。
在一种可能的实现方式中, 在移动终端中, 可以保存一个数据库, 在该 数据库中可以按照不同的对话风格保存用户与他人通过短信或者应用客户 端进行沟通的过程中产生的文本内容。 在该数据库中, 上述文本内容可以以 信息回复二元组的形式进行保存。 例如, 可以将对话风格设置为 "对领导 / 长辈的尊敬风格"、 "对朋友 /同事的随意风格"和 "对家人的亲密风格"等。 若用户的领导王某通过短信给用户发来一条短信:帮我定张机票,用户回复: 请您稍等, 一会儿帮您搞定。 可以将信息 1 "帮我定张机票", 回复 1 "请您 稍等, 一会儿帮您搞定"保存在 "对领导 /长辈的尊敬风格"的对话风格数据 库 1中。
在接收单元 310接收到待回复信息之后, 査找单元 320可以结合待回复信 息中的文本内容和联系人信息, 从数据库中査找当前的对话风格信息, 以使 得可以在该对话风格信息对应的数据库中査找到合适的回复信息。 例如, 接 收单元 310接收到好友刘某发送来的信息: 帮我定张机票, 文本内容为: 帮 我定张机票, 联系人信息可以包括姓名: 刘某、分组: 好友等, 査找单元 320 可以结合文本内容和联系人信息, 从数据库中査找当前的对话风格信息为 "对朋友 /同事的随意风格"。
对话风格信息的具体示例可以参见本发明上述实施例中的相关描述,在 此不再赘述。
处理单元 330, 与所述査找单元 320连接, 用于对所述文本内容进行预处 理, 所述预处理包括分词处理和去停用词处理。
具体地, 在査找单元 320査找到当前的对话风格信息之后, 处理单元 330 可以对待回复信息中的文本内容进行预处理, 该预处理可以包括对文本内容 进行分词处理和去停用词处理。 其中, 不同的文本内容都是由若干个单词或 词组组成的, 分词处理即将文本内容按照单词或词组进行拆分, 例如 "帮我 定张机票"通过分词处理之后可以变为 "帮 /我 /定 /张 /机票"; 此外, 在文本 内容中可能会包括一些停用词, 如 "的"、 "等"等词, 这些停用词对査询的 结果没有影响, 则可以通过去停用词处理将这个词去掉, 这样可以减少査找 过程的工作量, 加快系统的运行速度。
确定单元 340,与所述处理单元 330连接,用于根据所述预处理后的数据, 在所述对话风格信息对应的数据库中进行査找, 以确定回复信息。
具体地, 经过处理单元 330进行预处理之后, 待回复信息中的原始文本 内容可以变为处理后的査询信息, 以用于确定单元 340在对话风格信息对应 的数据库中进行査找, 从而确定用户可以回复的回复信息, 其中对话风格信 息为査找单元 320査找到的对话风格信息。
在移动终端中, 充分利用用户保存的联系人信息及产生的对话数据, 设 定不同的对话风格, 并根据对话风格信息将产生的对话数据分别保存在对应 的数据库中。 这样, 不需要将用户的对话数据上传至远程云端, 有利于保护 用户的隐私。
本实施例的信息回复装置, 査找单元根据待回复信息的文本内容和联系 人信息査找对话风格信息, 并以处理单元预处理后的文本内容作为査询信 息, 在该对话风格信息对应的数据库中进行査找, 可以査找到合适的回复信 息供用户选择并进行回复, 用户不需要手动输入回复信息, 可以缩短用户回 复信息的时间, 进一歩地, 通过对话风格的设置, 可以向用户提供与待回复 信息相匹配的风格的回复, 增强了用户体验。
图 4示出根据本发明另一实施例的信息回复装置的结构框图。 图 4中标号 与图 3相同的组件具有相同的功能, 为简明起见, 省略对这些组件的详细说 明。
如图 4所示, 图 4所示的信息回复装置 400与图 3所示的信息回复装置 300 的主要区别在于, 确定单元 340还可以包括:
检索单元 410,与所述处理单元 330连接,用于根据所述预处理后的数据, 从所述对话风格信息对应的数据库检索出备选的信息回复二元组;
所述确定单元 340还被配置为, 从所述信息回复二元组中确定所述回复
I Ft自、。
具体地, 在一种可能的实现方式中, 根据査找单元 320査找的对话风格 信息和处理单元 330预处理后的数据,检索单元 410可以在该对话风格信息对 应的数据库中检索出备选的信息回复二元组。 信息回复装置 400可以将这些 检索到的信息回复二元组推送给用户, 用户根据自身的需求, 可以从中选择 一条回复作为回复信息。 同时, 用户还可以对该回复信息作一些适当的调整 或者修改, 以使得回复的信息更加恰当。 具体示例可以参见本发明上述实施 例信息回复方法中的相关描述。
进一歩地, 确定单元 340还可以包括:
排序单元 420, 与所述检索单元 410连接, 用于如果从所述对话风格信息 对应的数据库中检索出多条所述信息回复二元组, 则根据重排序模型对多条 所述信息回复二元组进行重排序;
所述确定单元 340还被配置为, 从所述重排序后的信息回复二元组中确 定所述回复信息。
具体地, 在一种可能的实现方式中, 如果歩骤 200检索单元 410检索到多 条 (如 20条) 信息回复二元组, 这时如果信息回复装置 400将这些信息回复 二元组直接推送给用户, 用户可能无法很快地选择出合适的回复信息, 无法 提供很好的用户体验。 可以在信息回复装置中设置一种重排序模型。 在检索 单元 410检索出多条信息回复二元组之后,排序单元 420可以根据该重排序模 型对这些信息回复二元组进行重排序, 重排序之后, 可以将热点程度较高的 信息回复二元组排在靠前的位置推送给用户, 其中热点程度较高表示用户使 用较为频繁或者回复的可能性较大。重排序模型以及重排序过程的具体示例 可以参见本发明上述实施例信息回复方法中的相关描述。
在一种可能的实现方式中, 在信息回复装置 400中, 可以设置两个初始 值(如 N, K) , 其中初始值 N可以表示检索单元 410检索出的信息回复二元组 个数,初始值 K可以表示信息回复装置 400推送给用户的待选择的信息回复二 元组个数。 例如, 可以设置初始值 N=20, K=3, 则检索单元 410在对话风格 信息对应的数据库中检索时,需要检索出 Ν=20条信息回复二元组。排序单元 420对这些信息回复二元组根据重排序模型进行重排序之后,选择前 Κ=3条信 息回复二元组作为待选择的信息回复二元组推送给用户, 以供用户选择、 修 改以及回复。
需要说明的是, 除了开发者可以设置这两个初始值之外, 在用户使用移 动终端的过程中, 用户还可以根据自身的需求对初始值进行修改, 以提供更 好的用户体验。
在一种可能的实现方式中, 该信息回复装置 400还可以包括:
训练单元 430, 用于按照第一设定周期, 根据所述数据库中的数据, 训 练学习所述重排序模型。
具体地, 随着用户使用移动终端, 由短信和应用客户端产生的对话数据 越来越多, 在数据库中保存的信息回复二元组也会随之增多, 这样初始阶段 设置的重排序模型准确度可能会降低, 排序单元 420根据重排序模型进行重 排序之后, 可能不会将热点程度较高的信息回复二元组排在靠前的位置, 影 响用户的选择。
在一种可能的实现方式中, 在信息回复装置 400中, 可以由开发者设置 一个第一设定周期 (如 30天), 训练单元 430可以按照第一设定周期, 根据数 据库中的对话数据、 信息回复二元组指示的信息回复对应关系, 重新训练学 习一个新的重排序模型, 得到准确度高的重排序模型, 以使得用户可以快速 的得到更为恰当的回复信息。 在另一种可能的实现方式中, 用户可以根据自 身的需求对第一设定周期进行修改。具体示例可以参见本发明上述实施例信 息回复方法中的相关描述。
通过用户主动修改第一设定周期, 以较合适的频率启动训练单元 430训 练学习重排序模型的过程,可以避免过于频繁的训练学习重排序模型导致的 移动终端运行缓慢的问题,还可以避免由于重排序模型准确度降低引起的用 户体验下降的问题。
在一种可能的实现方式中, 该信息回复装置 400还可以包括: 统计单元 440, 用于按照第二设定周期, 对所述数据库中的数据进行数 据统计, 得到所述待回复信息中单词的统计信息, 所述单词为对所述待回复 信息中的文本内容进行分词处理之后得到的;
确定单元 340还被配置为: 根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的数据库检索出备选的信息回复二元组。
具体地, 在信息回复装置 400中, 可以由开发者设置一个第二设定周期 (如 30天), 统计单元 440可以按照第二设定周期, 移动终端可以自动对数据 库中的对话数据和预处理后的数据进行数据统计, 以得到统计信息, 以使得 确定单元 340可以根据预处理后的数据和统计信息, 检索与待回复信息相关 的信息回复二元组。 在另一种可能的实现方式中, 用户可以根据自身的需求 对第二设定周期进行修改。具体示例可以参见本实施例中信息回复方法的相 关描述。
在一种可能的实现方式中,对待回复信息中的文本内容进行分词处理之 后, 可以得到相应的单词, 例如上述实施例中的相关描述, 预处理后, 可以 得到 "帮 /我 /定 /张 /机票"等多个单词。 统计单元 440可以按照第二设定周期, 对数据库中预处理后得到的单词进行数据统计, 得到单词在某个句子中或者 某个文档中出现的概率即词频。 在检索单元 410进行检索的过程中, 考虑到 这些统计信息, 可以使检索的结果更加精确。
在一种可能的实现方式中, 该信息回复装置 400还可以包括:
分析单元 450, 与所述确定单元 340连接, 用于对所述待回复信息和所述 回复信息进行对话风格分析, 并对所述回复信息进行所述预处理;
存储单元 460,与所述分析单元 450连接,用于将分析后的对话风格信息、 预处理后的数据和原始数据存入所述数据库, 其中, 所述原始数据包括所述 待回复信息的文本内容和联系人信息, 以及所述回复信息的文本内容和联系 人信息。 具体地, 本实施例以及上述实施例的信息回复装置, 接收单元 310接收 到待回复信息、 确定单元 340确定回复信息并进行回复之后, 分析单元 450可 以对当前的对话数据即待回复信息和回复信息进行对话风格分析, 也可以对 回复信息进行预处理。 其中, 对话风格分析表示确定当前对话数据的对话风 格信息, 预处理的具体示例可以参见本发明上述实施例信息回复方法中的相 关描述。 存储单元 460可以将分析单元 450得到的对话风格信息、 预处理后的 数据和原始对话数据存入对话风格信息对应的数据库中, 以用于后续信息的 回复。
需要说明的是, 査找单元 320已经确定了当前对话数据的对话风格信息, 但是经过用户对回复信息的修改之后可能会改变对话数据的对话风格信息。 考虑到査找单元 320査找对话风格信息时的偏差和用户修改引起的对话风格 变化, 再进行一次对话风格分析, 以使得存储单元 460可以将对话数据保存 到最合适的对话风格信息对应的数据库中。而移动终端可以保存对待回复信 息的预处理结果, 并且在信息回复过程中, 待回复信息没有发生变化, 此时 不需要再对待回复信息进行预处理。
本实施例的信息回复装置, 査找单元根据待回复信息的文本内容和联系 人信息査找对话风格信息, 并以处理单元预处理后的文本内容作为査询信 息, 在该对话风格信息对应的数据库中进行査找, 可以査找到合适的回复信 息供用户选择并进行回复, 用户不需要手动输入回复信息, 可以缩短用户回 复信息的时间, 进一歩地, 通过对话风格的设置, 可以向用户提供与待回复 信息相匹配的风格的回复, 增强了用户体验。
图 5示出根据本发明的另一实施例的信息回复装置的结构框图。 所述信 息回复装置 500可以是具备计算能力的主机服务器、 个人计算机 PC、 或者可 携带的便携式计算机或移动终端等。本发明具体实施例并不对计算节点的具 体实现做限定。 所述信息回复装置 500包括处理器(processor)510、 通信接口 (Communications Interface)520、 存储器 (memory)530和总线 540。 其中, 处理 器 510、 通信接口 520、 以及存储器 530通过总线 540完成相互间的通信。
通信接口 520用于与网络设备通信, 其中网络设备包括例如虚拟机管理 中心、 共享存储等。
处理器 510用于执行程序。 处理器 510可能是一个中央处理器 CPU, 或者 是专用集成电路 ASIC (Application Specific Integrated Circuit) , 或者是被配 置成实施本发明实施例的一个或多个集成电路。
存储器 530用于存放文件。存储器 530可能包含高速 RAM存储器,也可能 还包括非易失性存储器 (non-volatile memory), 例如至少一个磁盘存储器。存 储器 530也可以是存储器阵列。 存储器 530还可能被分块, 并且所述块可按一 定的规则组合成虚拟卷。
在一种可能的实施方式中, 上述程序可为包括计算机操作指令的程序代 码。 该程序具体可用于:
接收待回复信息, 所述待回复信息包括文本内容和联系人信息; 根据所述文本内容和所述联系人信息,从数据库中査找对应的对话风格
I Ή自、 .,
对所述文本内容进行预处理, 所述预处理包括分词处理和去停用词处 理;
根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行査 找, 以确定回复信息。
在一种可能的实现方式中, 所述根据所述文本内容, 在所述对话风格信 息对应数据库中进行査找, 以确定回复信息, 包括:
根据所述预处理后的数据, 从所述对话风格信息对应的数据库检索出备 选的信息回复二元组; 从所述信息回复二元组中确定所述回复信息。
在一种可能的实现方式中, 从所述信息回复二元组中确定所述回复信 息, 包括:
如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二 元组, 则根据重排序模型对多条所述信息回复二元组进行重排序;
从所述重排序后的信息回复二元组中确定所述回复信息。
在一种可能的实现方式中, 还包括:
按照第一设定周期, 根据所述数据库中的数据, 训练学习所述重排序模 型。
在一种可能的实现方式中, 所述根据所述文本内容, 在所述对话风格信 息对应的数据库中进行査找, 以确定回复信息, 还包括:
按照第二设定周期, 对所述数据库中的数据进行数据统计, 得到所述待 回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进 行分词处理之后得到的;
根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的 数据库检索出备选的信息回复二元组。
在一种可能的实现方式中, 还包括:
对所述待回复信息和所述回复信息进行对话风格分析, 并对所述回复信 息进行所述预处理;
将分析后的对话风格信息、 预处理后的数据和原始数据存入所述数据 库,
其中, 所述原始数据包括所述待回复信息的文本内容和联系人信息, 以 及所述回复信息的文本内容和联系人信息。
本领域普通技术人员可以意识到, 本文所描述的实施例中的各示例性单 元及算法歩骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。 这些功能究竟以硬件还是软件形式来实现,取决于技术方案的特定应用和设 计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描 述的功能, 但是这种实现不应认为超出本发明的范围。
如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使 用时, 则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有 技术做出贡献的部分)是以计算机软件产品的形式体现的。 该计算机软件产 品通常存储在计算机可读取的非易失性存储介质中,包括若干指令用以使得 计算机设备(可以是个人计算机、 服务器、 或者网络设备等)执行本发明各 实施例方法的全部或部分歩骤。 而前述的存储介质包括 U盘、 移动硬盘、 只 读存储器 (ROM, Read-Only Memory )、 随机存取存储器 (RAM, Random Access Memory), 磁碟或者光盘等各种可以存储程序代码的介质。
以上所述, 仅为本发明的具体实施方式, 但本发明的保护范围并不局限 于此, 任何熟悉本技术领域的技术人员在本发明揭露的技术范围内, 可轻易 想到变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护 范围应所述以权利要求的保护范围为准。

Claims

权 利 要 求 书
1、 一种信息回复方法, 其特征在于, 包括:
接收待回复信息, 所述待回复信息包括文本内容和联系人信息; 根据所述文本内容和所述联系人信息,从数据库中査找对应的对话风格
I Ft Ή自、 .,
对所述文本内容进行预处理, 所述预处理包括分词处理和去停用词处 理;
根据所述预处理后的数据,在所述对话风格信息对应的数据库中进行査 找, 以确定回复信息。
2、 根据权利要求 1所述的信息回复方法, 其特征在于, 所述对话风格信 息为移动终端中预先保存的对话风格信息; 或
所述对话风格信息为所述移动终端响应用户操作生成的对话风格信息。
3、 根据权利要求 1所述的信息回复方法, 其特征在于, 所述根据所述预 处理后的数据, 在所述对话风格信息对应的数据库中进行査找, 以确定回复 信息, 包括:
根据所述预处理后的数据, 从所述对话风格信息对应的数据库检索出备 选的信息回复二元组;
从所述信息回复二元组中确定所述回复信息。
4、 根据权利要求 3所述的信息回复方法, 其特征在于, 从所述信息回复 二元组中确定所述回复信息, 包括:
如果从所述对话风格信息对应的数据库中检索出多条所述信息回复二 元组, 则根据重排序模型对多条所述信息回复二元组进行重排序;
从所述重排序后的信息回复二元组中确定所述回复信息。
5、 根据权利要求 4所述的信息回复方法, 其特征在于, 还包括: 按照第一设定周期, 根据所述数据库中的数据, 训练学习所述重排序模 型。
6、 根据权利要求 3所述的信息回复方法, 其特征在于, 所述根据所述预 处理后的数据, 在所述对话风格信息对应的数据库中进行査找, 以确定回复 信息, 还包括:
按照第二设定周期, 对所述数据库中的数据进行数据统计, 得到所述待 回复信息中单词的统计信息,所述单词为对所述待回复信息中的文本内容进 行分词处理之后得到的;
根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的 数据库检索出备选的信息回复二元组。
7、 根据权利要求 1至 6中任一项所述的信息回复方法, 其特征在于, 还 包括:
对所述待回复信息和所述回复信息进行对话风格分析, 并对所述回复信 息进行所述预处理;
将分析后的对话风格信息、 预处理后的数据和原始数据存入所述数据 库,
其中, 所述原始数据包括所述待回复信息的文本内容和联系人信息, 以 及所述回复信息的文本内容和联系人信息。
8、 一种信息回复装置, 其特征在于, 包括:
接收单元, 用于接收待回复信息, 所述待回复信息包括文本内容和联系 人信息;
査找单元, 与所述接收单元连接, 用于根据所述文本内容和所述联系人 信息, 从数据库中査找对应的对话风格信息;
处理单元, 与所述査找单元连接, 用于对所述文本内容进行预处理, 所 述预处理包括分词处理和去停用词处理;
确定单元, 与所述处理单元连接, 用于根据所述预处理后的数据, 在所 述对话风格信息对应的数据库中进行査找, 以确定回复信息。
9、 根据权利要求 8所述的信息回复装置, 其特征在于, 所述对话风格信 息为移动终端中预先保存的对话风格信息; 或
所述对话风格信息为所述移动终端响应用户操作生成的对话风格信息。
10、 根据权利要求 8所述的信息回复装置, 其特征在于, 所述确定单元 还包括:
检索单元, 与所述处理单元连接, 用于根据所述预处理后的数据, 从所 述对话风格信息对应的数据库检索出备选的信息回复二元组;
所述确定单元还被配置为, 从所述信息回复二元组中确定所述回复信 息。
11、 根据权利要求 10所述的信息回复装置, 其特征在于, 所述确定单元 还包括:
排序单元, 与所述检索单元连接, 用于如果从所述对话风格信息对应的 数据库中检索出多条所述信息回复二元组, 则根据重排序模型对多条所述信 息回复二元组进行重排序;
所述确定单元还被配置为, 从所述重排序后的信息回复二元组中确定所 述回复信息。
12、 根据权利要求 11所述的信息回复装置, 其特征在于, 还包括: 训练单元, 用于按照第一设定周期, 根据所述数据库中的数据, 训练学 习所述重排序模型。
13、 根据权利要求 10所述的信息回复装置, 其特征在于, 所述确定单元 还包括:
统计单元, 用于按照第二设定周期, 对所述数据库中的数据进行数据统 计, 得到所述待回复信息中单词的统计信息, 所述单词为对所述待回复信息 中的文本内容进行分词处理之后得到的;
所述确定单元还被配置为, 根据所述预处理后的数据和所述统计信息, 从所述对话风格信息对应的数据库检索出备选的信息回复二元组。
14、 根据权利要求 8至 13中任一项所述的信息回复装置, 其特征在于, 还包括:
分析单元, 与所述确定单元连接, 用于对所述待回复信息和所述回复信 息进行对话风格分析, 并对所述回复信息进行所述预处理;
存储单元, 与所述分析单元连接, 用于将分析后的对话风格信息、 预处 理后的数据和原始数据存入所述数据库,
其中, 所述原始数据包括所述待回复信息的文本内容和联系人信息, 以 及所述回复信息的文本内容和联系人信息。
PCT/CN2014/083346 2013-12-27 2014-07-30 信息回复方法及装置 WO2015096477A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/163,337 US10230668B2 (en) 2013-12-27 2016-05-24 Information replying method and apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310740010.4 2013-12-27
CN201310740010.4A CN104750705B (zh) 2013-12-27 2013-12-27 信息回复方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/163,337 Continuation US10230668B2 (en) 2013-12-27 2016-05-24 Information replying method and apparatus

Publications (1)

Publication Number Publication Date
WO2015096477A1 true WO2015096477A1 (zh) 2015-07-02

Family

ID=53477477

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/083346 WO2015096477A1 (zh) 2013-12-27 2014-07-30 信息回复方法及装置

Country Status (3)

Country Link
US (1) US10230668B2 (zh)
CN (1) CN104750705B (zh)
WO (1) WO2015096477A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018040040A1 (zh) * 2016-08-31 2018-03-08 北京小米移动软件有限公司 消息通信方法及装置

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104991779A (zh) * 2015-07-17 2015-10-21 小米科技有限责任公司 提示方法及装置
CN105138710B (zh) * 2015-10-12 2019-02-19 金耀星 一种聊天代理系统及方法
CN105224336A (zh) * 2015-10-23 2016-01-06 小米科技有限责任公司 信息列表生成方法和装置、智能设备
CN105391620B (zh) * 2015-12-02 2019-08-30 小米科技有限责任公司 信息提示方法及装置
US10606848B2 (en) * 2016-04-11 2020-03-31 Facebook, Inc. Techniques for device configuration using messaging history information
US10567312B2 (en) 2016-04-11 2020-02-18 Facebook, Inc. Techniques for messaging bot controls based on machine-learning user intent detection
CN107291684B (zh) * 2016-04-12 2021-02-09 华为技术有限公司 语言文本的分词方法和系统
US10902330B2 (en) * 2016-06-21 2021-01-26 International Business Machines Corporation Cognitive question answering pipeline calibrating
CN107040450B (zh) 2016-07-20 2018-06-01 平安科技(深圳)有限公司 自动回复方法和装置
WO2018036555A1 (zh) * 2016-08-25 2018-03-01 腾讯科技(深圳)有限公司 会话处理方法及装置
US11233760B2 (en) 2016-09-21 2022-01-25 Facebook, Inc. Module ranking for a modular inbox
US10841264B2 (en) 2016-09-21 2020-11-17 Facebook, Inc. Method and system for presenting a subset of messages in a modular inbox
US10356029B2 (en) 2016-09-21 2019-07-16 Facebook, Inc. Methods and systems for presenting modules in an inbox interface
US10367767B2 (en) 2016-09-21 2019-07-30 Facebook, Inc. Modular inbox and generation of content modules
US20180083896A1 (en) 2016-09-21 2018-03-22 Facebook, Inc. Modular inbox surface for content delivery
US10880237B2 (en) 2016-11-28 2020-12-29 Facebook, Inc. Methods and systems for ranking messaging bots
US20180349754A1 (en) * 2017-06-02 2018-12-06 Microsoft Technology Licensing, Llc Communication reply bot
CN108304436B (zh) 2017-09-12 2019-11-05 深圳市腾讯计算机系统有限公司 风格语句的生成方法、模型的训练方法、装置及设备
CN107566256B (zh) * 2017-09-13 2019-04-12 Oppo广东移动通信有限公司 信息回复方法、装置、终端和计算机可读存储介质
CN110019722B (zh) * 2017-12-21 2023-11-24 株式会社理光 对话模型的回复排序方法、装置及计算机可读存储介质
CN109032381B (zh) * 2018-08-01 2022-05-17 平安科技(深圳)有限公司 一种基于上下文的输入方法、装置、存储介质及终端
CN111831875B (zh) * 2019-04-11 2024-05-31 阿里巴巴集团控股有限公司 数据处理方法、装置、设备和存储介质
CN111984767A (zh) * 2019-05-23 2020-11-24 北京搜狗科技发展有限公司 一种信息推荐方法、装置和电子设备
CN113411246B (zh) * 2020-03-16 2023-04-18 北京搜狗科技发展有限公司 一种回复处理方法、装置和用于回复处理的装置
CN113973152A (zh) * 2020-07-06 2022-01-25 华为技术有限公司 一种未读消息快速回复方法及电子设备
CN112989015B (zh) * 2021-04-28 2021-08-06 武汉龙津科技有限公司 一种自适应的对话方法、装置、电子设备及可读存储介质
CN113094490B (zh) * 2021-05-13 2022-11-22 度小满科技(北京)有限公司 一种会话交互方法、装置、电子设备及存储介质
CN115186085A (zh) * 2022-07-28 2022-10-14 腾讯科技(北京)有限公司 回复内容处理方法以及媒体内容互动内容的交互方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101232532A (zh) * 2007-12-11 2008-07-30 中兴通讯股份有限公司 在移动终端中实现短信智能回复的装置和方法
CN101252615A (zh) * 2008-03-28 2008-08-27 宇龙计算机通信科技(深圳)有限公司 一种移动终端及其接入信息的自动响应方法及系统
CN101345717A (zh) * 2007-07-12 2009-01-14 英业达股份有限公司 可自动回应的即时通讯系统及其方法
CN102695138A (zh) * 2012-06-05 2012-09-26 宇龙计算机通信科技(深圳)有限公司 移动终端和自动回复处理方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6901364B2 (en) * 2001-09-13 2005-05-31 Matsushita Electric Industrial Co., Ltd. Focused language models for improved speech input of structured documents
US7738637B2 (en) * 2004-07-24 2010-06-15 Massachusetts Institute Of Technology Interactive voice message retrieval
US8684922B2 (en) * 2006-05-12 2014-04-01 Bao Tran Health monitoring system
US7509312B2 (en) * 2006-07-28 2009-03-24 International Business Machines Corporation Method and apparatus for managing peer-to-peer search results
US8180735B2 (en) * 2006-12-29 2012-05-15 Prodea Systems, Inc. Managed file backup and restore at remote storage locations through multi-services gateway at user premises
US8630625B2 (en) * 2007-09-14 2014-01-14 At&T Intellectual Property I, L.P. System and method for personalized messaging
US8082151B2 (en) * 2007-09-18 2011-12-20 At&T Intellectual Property I, Lp System and method of generating responses to text-based messages
CN101470700A (zh) * 2007-12-28 2009-07-01 日电(中国)有限公司 文本模板生成器、文本生成设备、文本检验设备及其方法
US20140096033A1 (en) * 2008-03-06 2014-04-03 Software Hot-House Ltd. Enhancements to unified communications and messaging systems
US20120221962A1 (en) * 2008-08-05 2012-08-30 Eugene Lee Lew Social messaging hub system
US20110208822A1 (en) * 2010-02-22 2011-08-25 Yogesh Chunilal Rathod Method and system for customized, contextual, dynamic and unified communication, zero click advertisement and prospective customers search engine
CN101895607A (zh) * 2010-05-10 2010-11-24 华为终端有限公司 一种保护用户隐私信息的方法及终端
US20110288897A1 (en) * 2010-05-24 2011-11-24 Avaya Inc. Method of agent assisted response to social media interactions
US8713445B2 (en) * 2010-11-12 2014-04-29 Sap Ag Systems and methods for generating customized user interfaces
US8589407B2 (en) * 2011-06-17 2013-11-19 Google Inc. Automated generation of suggestions for personalized reactions in a social network
US20130035946A1 (en) * 2011-08-03 2013-02-07 Suneel James Ratan Social networks for care coordination, management, and support and health information exchange
US9454280B2 (en) * 2011-08-29 2016-09-27 Intellectual Ventures Fund 83 Llc Display device providing feedback based on image classification
KR101977087B1 (ko) * 2012-12-24 2019-05-10 엘지전자 주식회사 자동응대 기능을 갖는 이동 단말기 및 그의 자동응대 방법
US9575635B2 (en) * 2013-01-04 2017-02-21 Apple Inc. Return to sender
US10162884B2 (en) * 2013-07-23 2018-12-25 Conduent Business Services, Llc System and method for auto-suggesting responses based on social conversational contents in customer care services
EP3069546A1 (en) * 2013-12-18 2016-09-21 Apple Inc. Gesture-based information exchange between devices in proximity

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101345717A (zh) * 2007-07-12 2009-01-14 英业达股份有限公司 可自动回应的即时通讯系统及其方法
CN101232532A (zh) * 2007-12-11 2008-07-30 中兴通讯股份有限公司 在移动终端中实现短信智能回复的装置和方法
CN101252615A (zh) * 2008-03-28 2008-08-27 宇龙计算机通信科技(深圳)有限公司 一种移动终端及其接入信息的自动响应方法及系统
CN102695138A (zh) * 2012-06-05 2012-09-26 宇龙计算机通信科技(深圳)有限公司 移动终端和自动回复处理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018040040A1 (zh) * 2016-08-31 2018-03-08 北京小米移动软件有限公司 消息通信方法及装置

Also Published As

Publication number Publication date
CN104750705B (zh) 2019-05-28
US20160269326A1 (en) 2016-09-15
CN104750705A (zh) 2015-07-01
US10230668B2 (en) 2019-03-12

Similar Documents

Publication Publication Date Title
WO2015096477A1 (zh) 信息回复方法及装置
CN107797984B (zh) 智能交互方法、设备及存储介质
CN108197282B (zh) 文件数据的分类方法、装置及终端、服务器、存储介质
CN107578771B (zh) 语音识别方法及装置、存储介质、电子设备
WO2018219023A1 (zh) 一种语音关键词识别方法、装置、终端及服务器
US10270736B2 (en) Account adding method, terminal, server, and computer storage medium
US9767183B2 (en) Method and system for enhanced query term suggestion
CN109032381B (zh) 一种基于上下文的输入方法、装置、存储介质及终端
WO2017219696A1 (zh) 文本信息处理方法、装置及终端
WO2017143930A1 (zh) 一种搜索结果排序方法及其设备
CN110163121B (zh) 图像处理方法、装置、计算机设备及存储介质
CN110083693A (zh) 机器人对话回复方法及装置
JP6932360B2 (ja) オブジェクト検索方法、装置およびサーバ
WO2016095645A1 (zh) 笔画输入方法、装置和系统
CN114444619B (zh) 样本生成方法、训练方法、数据处理方法以及电子设备
WO2019238125A1 (zh) 信息处理方法、相关设备及计算机存储介质
WO2018041036A1 (zh) 关键词的查找方法、装置及终端
CN111506717B (zh) 问题答复方法、装置、设备及存储介质
KR20210118429A (ko) 개인화된 비디오들을 검색하고 랭킹하기 위한 방법들 및 시스템들
CN108090193B (zh) 异常文本的识别方法和装置
CN110990708B (zh) 热点事件确定方法、装置、存储介质及电子设备
US11289071B2 (en) Information processing system, information processing device, computer program, and method for updating dictionary database
CN111639199A (zh) 多媒体文件推荐方法、装置、服务器及存储介质
WO2021244424A1 (zh) 中心词提取方法、装置、设备及存储介质
EP4030335A1 (en) Artificial intelligence-based semantic identification method, device, and semantic identification apparatus

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14875586

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14875586

Country of ref document: EP

Kind code of ref document: A1