CN113516515B - 信息推送方法、装置、系统、电子设备及存储介质 - Google Patents
信息推送方法、装置、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113516515B CN113516515B CN202110825589.9A CN202110825589A CN113516515B CN 113516515 B CN113516515 B CN 113516515B CN 202110825589 A CN202110825589 A CN 202110825589A CN 113516515 B CN113516515 B CN 113516515B
- Authority
- CN
- China
- Prior art keywords
- user
- content
- matching
- determining
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 239000013598 vector Substances 0.000 claims description 68
- 238000012545 processing Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 11
- 230000004927 fusion Effects 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 238000013459 approach Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请实施例提供了一种信息推送方法、装置、系统、电子设备及存储介质,方法包括:获取目标用户输入的用户消息;将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容;确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;向目标用户推送目标推送内容。能够确定语义匹配度和数量值均满足预设条件的推送内容,提高信息推送的效率和准确率。
Description
技术领域
本申请涉及信息技术领域,更具体地,涉及一种信息推送方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,智能客服技术为企业与海量用户之间建立了一种基于自然语言的快捷有效的沟通方式,目前已在各个行业广泛应用。智能客服系统可以在对话过程中向用户推送其感兴趣的信息,以提升用户的使用体验。但目前的推送方式通常需要与用户进行多轮对话来确定向用户推送的信息,信息推送效率较低,用户体验较差。
发明内容
鉴于上述问题,本申请提出了一种信息推送方法、装置、电子设备及存储介质,以改善上述缺陷。
第一方面,本申请实施例提供了一种信息推送方法,包括:获取目标用户输入的用户消息;将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度,每个所述匹配文本对应至少一个预设内容;确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个所述预设内容的第一数量值;确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及向所述目标用户推送所述目标推送内容。
进一步地,所述方法还包括:若所述第一数量值大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容;获取所述目标用户对应的用户画像和每个所述待推送内容对应的多个历史用户对应的用户画像;基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度;及根据所述用户兴趣度对所述待推送内容进行降序排序,将排序在前的指定数量的所述待推送内容确定为所述目标推送内容。
进一步地,所述待推送内容包括至少一个候选推送内容,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度,包括:基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值;及根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度。
进一步地,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;确定所述用户相似度是否大于预设相似度阈值,若是,则判定该历史用户与所述目标用户匹配;获取每个所述待推送内容的与所述目标用户匹配的历史用户数量值;及将最大历史用户数量值对应的待推送内容确定为第一候选内容,并根据所述最大历史用户数量值确定所述第一候选内容的权重值。
进一步地,所述基于所述目标用户对应的用户画像和所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;及将最大用户相似度对应的待推送内容确定为第二候选内容,并根据所述最大用户相似度确定所述第二候选内容的权重值。
进一步地,所述目标用户对应的用户画像和所述历史用户对应的用户画像分别包括多个标签,所述将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度,包括:融合所述目标用户对应的用户画像的所述多个标签的标签特征向量,得到所述目标用户的目标用户向量;融合每个所述历史用户对应的用户画像的所述多个标签的标签特征向量,得到每个所述历史用户的历史用户向量;及将多个所述历史用户向量分别与所述目标用户向量进行匹配,得到每个所述历史用户与所述目标用户的所述用户相似度。
进一步地,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:根据每个所述待推送内容的多个所述历史用户对应的用户画像,确定每个所述待推送内容对应的一个预测用户画像;将每个所述待推送内容对应的所述预测用户画像分别与所述目标用户对应的用户画像进行匹配,得到每个所述预测用户画像与所述目标用户对应的用户画像的用户相似度;及将最大用户相似度对应的待推送内容确定为第三候选内容,并根据所述最大用户相似度确定所述第三候选内容的权重值。
进一步地,所述根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度,包括:获取所述用户消息的输入时间,根据所述输入时间确定所述权重值的时间系数;获取所述目标用户的历史数据,所述历史数据包括由多个历史用户消息得到的每个所述候选推送内容的权重值和该权重值的时间系数;及对每个所述权重值和所述时间系数的乘积进行求和处理,得到所述候选推送内容的所述用户兴趣度。
进一步地,在获取所述用户消息的输入时间之前,所述方法还包括:获取不同的所述候选推送内容的第二数量值;确定所述第二数量值是否不大于所述数值阈值,若是,则将每个所述候选推送内容的所述权重值的和确定为该候选推送内容的所述用户兴趣度,将所述候选推送内容确定为所述目标推送内容;及若否,则获取所述用户消息的所述输入时间。
进一步地,在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之后,所述方法还包括:获取所述用户消息的输入时间;将每个所述预设内容的所述语义匹配度进行归一化处理,得到每个所述预设内容的权重值;及将每个所述预设内容的所述权重值和所述输入时间保存为所述目标用户的历史数据。
进一步地,所述知识库包括公共知识库和专有知识库,所述匹配文本包括第一匹配文本和第二匹配文本,在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之前,所述方法还包括:获取所述预设内容和所述预设内容对应的对话数据;拆分所述对话数据得到多个问答文本;将公共知识库中与所述多个问答文本相同的文本确定为所述预设内容对应的所述第一匹配文本;及将所述第一匹配文本以外的所述多个问答文本确定为所述预设内容对应的所述第二匹配文本,添加所述第二匹配文本至所述预设内容的专有知识库。
第二方面,本申请实施例提供了一种信息推送装置,其特征在于,包括:消息获取模块,用于获取目标用户输入的用户消息;语义匹配模块,用于将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度,每个所述匹配文本对应至少一个预设内容;匹配度判断模块,用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个所述预设内容的第一数量值;第一数量值判断模块,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及信息推送模块,用于向所述目标用户推送所述目标推送内容。
进一步地,所述第一数量值判断模块包括:待推送内容确定子模块、用户画像获取子模块、用户兴趣度确定子模块以及排序子模块;其中,所述待推送内容确定子模块,用于若所述第一数量值大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容;用户画像获取子模块,用于获取所述目标用户对应的用户画像和每个所述待推送内容对应的多个历史用户对应的用户画像;用户兴趣度确定子模块,用于基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度;及排序子模块,用于根据所述用户兴趣度对所述待推送内容进行降序排序,将排序在前的指定数量的所述待推送内容确定为所述目标推送内容。
进一步地,所述待推送内容包至少一个候选推送内容,所述用户兴趣度确定子模块包括:权重值确定单元和兴趣度确定单元,其中,所述权重值确定单元用于基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值;及所述兴趣度确定单元,用于根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度。
进一步地,所述权重值确定单元包括:第一用户相似度确定子单元,相似度阈值判断子单元,历史用户数量值获取子单元以及第一候选内容确定子单元,其中,第一用户相似度确定子单元,用于将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;相似度阈值判断子单元,用于确定所述用户相似度是否大于预设相似度阈值,若是,则判定该历史用户与所述目标用户匹配;历史用户数量值获取子单元,用于获取每个所述待推送内容的与所述目标用户匹配的历史用户数量值;及第一候选内容确定子单元,用于将最大历史用户数量值对应的待推送内容确定为第一候选内容,并根据所述最大历史用户数量值确定所述第一候选内容的权重值
进一步地,所述权重值确定单元包括:第一用户相似度确定子单元以及第二候选内容确定子单元,其中,所述第一用户相似度确定子单元,用于将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;及所述第二候选内容确定子单元,用于将最大用户相似度对应的待推送内容确定为第二候选内容,并根据所述最大用户相似度确定所述第二候选内容的权重值。
进一步地,所述目标用户对应的用户画像和所述历史用户对应的用户画像分别包括多个标签,所述第一用户相似度确定子单元,包括第一向量融合次子单元、第二向量融合次子单元以及向量匹配次子单元。其中,第一向量融合次子单元,用于融合所述目标用户对应的用户画像的所述多个标签的标签特征向量,得到所述目标用户的目标用户向量;第二向量融合次子单元,用于融合每个所述历史用户对应的用户画像的所述多个标签的标签特征向量,得到每个所述历史用户的历史用户向量;及向量匹配次子单元,用于将多个所述历史用户向量分别与所述目标用户向量进行匹配,得到每个所述历史用户与所述目标用户的所述用户相似度。
进一步地,所述权重值确定单元包括:预测用户画像确定子单元、第二用户相似度确定子单元以及第三候选内容确定子单元。其中,所述预测用户画像确定子单元,用于根据每个所述待推送内容的多个所述历史用户对应的用户画像,确定每个所述待推送内容对应的一个预测用户画像;所述第二用户相似度确定子单元,用于将每个所述待推送内容对应的所述预测用户画像分别与所述目标用户对应的用户画像进行匹配,得到每个所述预测用户画像与所述目标用户对应的用户画像的用户相似度;及所述第三候选内容确定子单元,用于将最大用户相似度对应的待推送内容确定为第三候选内容,并根据所述最大用户相似度确定所述第三候选内容的权重值。
进一步地,所述兴趣度确定单元包括:时间系数确定子单元、历史数据获取子单元以及求和处理子单元。其中,所述时间系数确定子单元,用于获取所述用户消息的输入时间,根据所述输入时间确定所述权重值的时间系数;所述历史数据获取子单元,用于获取所述目标用户的历史数据,所述历史数据包括由多个历史用户消息得到的每个所述候选推送内容的权重值和该权重值的时间系数;及所述求和处理子单元,用于对每个所述权重值和所述时间系数的乘积进行求和处理,得到所述候选推送内容的所述用户兴趣度。
进一步地,所述兴趣度确定单元还包括:第二数量值获取子单元、第二数量值判断子单元以及时间系数获取子单元。其中,所述第二数量值获取子单元,用于在所述获取所述用户消息的输入时间之前,获取不同的所述候选推送内容的第二数量值;第二数量值判断子单元,用于确定所述第二数量值是否不大于所述数值阈值,若是,则将每个所述候选推送内容的所述权重值的和确定为该候选推送内容的所述用户兴趣度,将所述候选推送内容确定为所述目标推送内容;及所述时间系数获取子单元,用于若否,则获取所述用户消息的所述输入时间。
进一步地,所述信息推送装置还包括时间系数确定模块、归一化处理模块以及历史数据保存模块。其中,所述时间确定模块,用于获取所述用户消息的输入时间;所述归一化处理模块,用于将每个所述预设内容的所述语义匹配度进行归一化处理,得到每个所述预设内容的权重值;及所述历史数据保存模块,用于将每个所述预设内容的所述权重值和所述输入时间保存为所述目标用户的历史数据。
进一步地,所述知识库包括公共知识库和专有知识库,所述匹配文本包括第一匹配文本和第二匹配文本,所述信息推送装置还包括:对话数据获取模块、问答文本获取模块、第一匹配文本确定模块,以及第二匹配文本确定模块。其中,所述对话数据获取模块,用于在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之前,获取所述预设内容和所述预设内容对应的对话数据;所述问答文本获取模块,用于拆分所述对话数据得到多个问答文本;所述第一匹配文本确定模块,用于将公共知识库中与所述多个问答文本相同的文本确定为所述预设内容对应的所述第一匹配文本;及所述第二匹配文本确定模块,用于将所述第一匹配文本以外的所述多个问答文本确定为所述预设内容对应的所述第二匹配文本,添加所述第二匹配文本至所述预设内容的专有知识库。
第三方面,本申请实施例提供了一种信息推送系统,其特征在于,所述信息推送系统包括知识库单元、对话单元和推送单元;所述对话单元,用于获取目标用户输入的用户消息,识别所述用户消息的语义信息;所述推送单元,用于从所述对话单元获取所述语义信息,从所述知识库单元获取多个匹配文本,每个所述匹配文本对应至少一个预设内容;所述推送单元,用于将所述多个匹配文本分别与所述语义信息进行匹配,获取多个语义匹配度;所述推送单元用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;所述推送单元,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则从所述知识库单元获取所述最大语义匹配度的匹配文本对应的至少一个预设内容,将该至少一个预设内容确定为目标推送内容;及所述推送单元,用于向所述目标用户推送所述目标推送内容。
第四方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述第一方面或第二方面所述的方法。
第五方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如上述第一方面或第二方面所述的方法。
本申请实施例提供了一种信息推送方法、装置、系统、电子设备及存储介质,方法包括:获取目标用户输入的用户消息;将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容;确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及向目标用户推送目标推送内容。能够将语义匹配度和数量值均满足预设条件的预设推送内容确定为目标推送内容,提高了信息推送的效率和准确率,改善了用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了一种适用于本申请实施例的应用环境示意图;
图2示出了本申请一实施例提供的信息推送方法的流程示意图;
图3示出了本申请另一实施例提供的信息推送方法的流程示意图;
图4示出了本申请又一实施例提供的信息推送方法的流程示意图;
图5示出了本申请一实施例提供的图4中步骤S470的流程示意图;
图6示出了图5中步骤S4710的流程示意图;
图7示出了本申请另一实施例提供的图4中步骤S470的流程示意图;
图8示出了本申请又一实施例提供的图4中步骤S470的流程示意图;
图9示出了本申请再一实施例提供的信息推送方法的流程示意图;
图10示出了图9中步骤S580前的执行步骤的流程示意图;
图11示出了本申请又另一实施例提供的信息推送方法的流程示意图;
图12示出了本申请又再一实施例提供的信息推送方法的流程示意图;
图13示出了本申请一实施例提供的信息推送装置的结构框图;
图14示出了本申请一实施例提供的信息推送系统的结构框图;
图15示出了本申请一实施例提供的信息推送系统的示意图;
图16示出了本申请实施例的用于执行根据本申请实施例的信息推送方法的电子设备的结构框图;
图17示出了本申请实施例的用于保存或者携带实现根据本申请实施例的信息推送方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着科技的进步,人工智能技术越来越普及,日常生活中如预约、咨询等服务已经从人工服务转变成了机器服务。相比于人工服务,通过机器服务大大提高了服务效率,为人们的日常生活带来了极大的便利。智能客服可以通过与用户进行对话的方式来为用户提供服务。具体地,用户可以在与智能客服进行对话的对话界面上输入问题,智能客服基于自然语言理解识别用户输入的问题,向用户推送答案。在对话过程中,智能客服可以根据用户输入的用户消息推送目标预设内容。其中,目标预设内容可以是预设的图片或者文本。
当前推送的目标预设内容通常是固定的或者根据热度进行排序得到的,并不一定符合用户的意图,用户体验不好。在一些实施方式中,智能客服可以根据用户输入的用户消息开展多轮对话,来确定符合用户意图的预设内容。但是这种方式需要用户多次输入信息,信息推送效率较低,用户体验较差。
为了改善上述问题,发明人提出了本申请实施例中信息推送方法、装置、系统、电子设备及存储介质。能够将语义匹配度和数量值均满足预设条件的预设推送内容确定为目标推送内容,使得目标推送内容更符合目标用户的用户意图,改善了用户体验。
请参阅图1,图1示出了一种适用于本申请实施例的应用环境示意图。本申请实施例提供的信息推送方法可以应用于如图1所示的信息推送系统10。信息推送系统10包括至少一个终端设备100和服务器200,终端设备100和服务器200位于无线网络或有线网络中,终端设备100和服务器200进行数据交互,交互数据包括但不限于音频、视频、文字、图像等。
其中,终端设备100可以为移动终端设备,例如可以包括智能手机、平板电脑、电子书阅读器、膝上型便携计算机、车载电脑、穿戴式移动终端等等。其中,服务器200可以是单独的服务器,也可以是服务器集群,还可以是多台服务器构成的服务器中心,可以是本地服务器,也可以是云端服务器。服务器200可用于为用户提供后台服务,该后台服务可包括但不限于推送内容等,在此不作限定。
在一些实施方式中,终端设备100上可以安装有客户端应用程序,用户可以基于客户端应用程序(例如APP等)与服务器200进行通信。具体地,终端设备100可以获取用户的输入信息,基于终端设备100上的客户端应用程序与服务器200进行通信,服务器200可以对接收到的用户输入信息进行处理,服务器200还可以根据该信息返回对应的输出信息至终端设备100,终端设备100可执行输出信息对应的操作。其中,用户的输入信息可以是语音信息、基于屏幕的触控操作信息、手势信息、动作信息等,输出信息可以是图像、视频、文字、音频等,在此不做限定。
服务器200能够收集用户在客户端应用程序的用户数据,具体地,用户数据可以包括用户对话请求对应的入口标识,以及用户的对话日志。可选地,服务器200可以根据所收集的对话日志,为终端设备100的用户推送信息;服务器200也可以将所收集的对话日志发送至终端设备100,以使终端设备100根据对话日志来确定推送信息。
于本申请实施例中,客户端应用程序可以是即时通讯客户端、具有对话功能的应用程序如搜索引擎等,或者是终端系统本身的服务程序,用户可以在客户端应用程序的对话界面上输入信息进行对话。当服务器获取到用户在客户端应用程序的对话界面上输入的用户消息时,可以根据该用户消息在预设内容中确定目标推送内容,向用户推送目标推送内容,在终端设备上显示该目标推送内容。在一些实施方式中,对用户输入信息进行处理的装置也可以设置于终端设备100上,使得终端设备100无需依赖与服务器200建立通信即可实现与用户的交互,实现信息推送,此时信息推送系统10可以只包括终端设备100。
上述的应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。
下面将通过具体实施例对本申请实施例提供的信息推送方法、装置、电子设备及介质进行详细说明。
请参阅图2,图2为本申请一实施例提供的信息推送方法的流程示意图。信息推送方法包括S210至S250。
S210:获取目标用户输入的用户消息。
用户消息为用户输入的文本信息。该文本信息可以是用户通过触控方式输入的消息,也可以是音频采集得到的语音内容,通过自然语言理解得到的该语音内容的文本信息。在一些实施方式中,当终端设备接收到目标用户触发的消息交互指令时,可以在终端设备上显示对话界面。可选地,在获取到目标用户基于对话界面输入的用户消息后,可以将用户消息显示在对话界面上。
具体地,对话界面可以是用于即时通讯的界面,可用于目标用户与交互对象进行消息交互,其中,交互对象可以是智能客服、虚拟主播等对话机器人,也可以是人工客服等真人用户。例如,当接收到目标用户点击交互界面上的客服按键时,触发用于智能客服服务的对话界面,获取目标用户在该对话界面上输入的文本,并在对话界面上显示该文本。
S220:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
知识库是根据预设内容预先设置的,知识库可以包括多个匹配文本,每个匹配文本对应至少一个预设内容。预设内容可以是多模态的内容,预设内容的形式可以为文本、音频、图像或者视频等形式,或者上述形式的结合。其中,匹配文本可以包括常见问答对中的问题文本和任务型多轮对话中的问题文本中至少一个。每个常见问答对可以包括一个问题文本和该问题文本对应的答案文本,任务型多轮对话包括澄清需求、引导用户、询问、确认、对话结束语等一系列的多个问题文本和每个问题文本对应的答案文本。可选地,匹配文本也可以包括问题文本和答案文本。可以理解的是,问题文本为表示用户意图的文本,并不一定是问句。例如“我想办信用卡”可以被作为问题文本。
匹配文本和预设内容的对应关系为预先设置的,每个匹配文本对应至少一个预设内容。具体地,匹配文本可以是与预设内容一一对应的;一个匹配文本也可以对应多个预设内容;也可以一部分的匹配文本和预设内容一一对应,一部分的匹配文本对应多个预设内容。例如,预设内容为信用卡广告和贷款广告,匹配文本为“我想办信用卡”,“怎么借钱”。“我想办信用卡”对应“信用卡广告”,“怎么借钱”同时对应信用卡广告和贷款广告两个预设内容。作为一种方式,可以在知识库中根据实体建立对应的匹配文本,并确定该实体对应的预设内容,从而确定匹配文本和预设内容的对应关系。其中,实体可以是预设的产品等。
服务器或者终端设备可以基于预先训练的自然语言理解模型,分别对知识库中的多个匹配文本与用户消息进行匹配,以获取多个语义匹配度。其中,语义匹配度用于表征每个匹配文本和用户消息的语义表达的相似度,语义匹配度越高,匹配文本和用户向量的相关度越高,其所反映的用户意图越相似。作为一种方式,可以预先生成并存储每个匹配文本对应的语义向量,当获取到目标用户的用户消息时,获取该用户消息的语义向量,进而对匹配文本和用户消息的语义向量进行匹配,以得到每个匹配文本和该用户消息的语义向量的语义匹配度。由于匹配文本的语义向量为预先生成的,可以提高进行语义匹配的效率。
其中,自然语言理解模型可以包括但不限于:深度神经网络(Deep NeuralNetworks,DNN)、循环神经网络(Recurrent Neural Networks,RNN)、卷积神经网络(Convolutional Neural Networks,CNN)、基于变换器的双向编码表示网络模型(Bidirectional Encoder Representation from Transformers,BERT)、词向量模型(doc2Vec)等。
S230:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
在获取到多个语义匹配度后,可以将多个语义匹配度中的最大值确定为最大语义匹配度,进而判断最大语义匹配度是否大于匹配阈值。匹配阈值为预先设定的用于表征语义匹配度对应的匹配文本和用户消息具有关联的数值,匹配阈值越大,说明对匹配的语义相似度要求越高。匹配阈值可以根据经验设置,也可以根据知识库中预设内容的数量的类型灵活调整,本申请实施例对此不加以限定。
若最大语义匹配度大于匹配阈值,则判定该匹配文本和用户消息匹配,根据匹配文本和预设内容的对应关系,确定最大语义匹配度的匹配文本所对应的至少一个预设内容,并将至少一个预设内容中预设内容的数量确定为第一数量值。可以理解的是,当匹配文本和预设内容一一对应时,第一数量值为1,当匹配文本对应多个预设内容时,第一数量值为大于1的数值。若最大语义匹配度不大于匹配阈值,则不执行S240。
在一些实施方式中,可以获取用户消息的输入时间;将每个预设内容的语义匹配度进行归一化处理,得到每个预设内容的权重值;及将每个预设内容的权重值和输入时间保存为目标用户的历史数据。其中,不大于匹配阈值的语义匹配度也可以被保存,具体地,请参见后续的实施例。
S240:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
在获取到第一数量值后,可以进一步判断第一数量值是否不大于数值阈值。数值阈值为预先设定的向用户推送的预设内容的数量。其中,数值阈值可以根据对话界面上能够最大推送的预设内容的数量进行设置,也可以根据经验进行设置。若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容,其中,目标推送内容为用于向用户进行推送的内容。可选地,目标推送内容可以包括所确定的预设内容和预设的引导语,例如,目标推送内容可以是一款APP产品广告,引导语可以是“该产品功能逆天,你要不是试试~”。
在一些实施方式中,数值阈值可以设置为1,即当最大语义匹配度对应的匹配文本和预设内容一一对应时,第一数量值不大于数值阈值,将语义匹配度最高的一个预设内容确定为目标推送内容,能够避免推送多个预设内容对用户造成的打扰,以及对用户注意力的分散,从而提高转化率。
S250:向目标用户推送目标推送内容。
目标推送内容被推送至目标用户的终端设备上,以使终端设备通过应用程序显示该目标推送信息。作为一种方式,还可以向目标用户推送目标推送信息的关联信息,该关联信息可以是目标推送信息对应的详情界面等信息,以便在显示目标推送内容时,若获取到用户对目标推送内容的触控操作时,进一步显示对应的关联信息。
在一些实施方式中,在确定目标推送内容后,可以将目标推送内容和目标用户的用户信息存储为一条商机信息,其中,用户信息可以包括目标用户对应的用户标识。可选地,用户信息还可以包括推送后目标用户对该目标推送内容的交互操作,例如,浏览、点击、购买等操作。在与不同的目标用户交互过程中,通过记录商机信息,可以得到被推送过的目标推送内容对应的目标用户,进而可以通过外呼机器人、人工客服等方式进一步地使目标推送内容触达其对应的目标用户,以便于后续提高各目标推送内容的转化率。
可以理解的是,本实施例中上述的各个步骤,可以均由终端设备在本地进行,也可以均在服务器中进行,还可以由终端设备与服务器分工进行,根据实际应用场景的不同,可以按照需求进行任务的分配,以实现最优化的信息推送,在此并不作限定。
本申请实施例提供的信息推送方法,通过获取目标用户输入的用户消息;将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容;确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及向目标用户推送目标推送内容。通过同时考虑匹配阈值和数值阈值,能够将语义匹配度和数量值均满足预设条件的预设推送内容确定为目标推送内容,使得目标推送内容不但能够符合目标用户的用户意图,也能够符合推送的预设数量,提高了信息推送的效率和准确率,改善了用户体验。
请参阅图3,图3为本申请一实施例提供的信息推送方法的流程示意图,应用于上述服务器。信息推送方法包括S310至S390。
S310:获取目标用户输入的用户消息。
S320:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
S330:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
S340:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
S350:若第一数量值大于数值阈值,则将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容。
若第一数量值大于数值阈值时,最大语义匹配度对应的预设内容的数量大于能够被推送的数值阈值的数量,需要进一步地对预设内容进行筛选,以从中确定不大于数量阈值的预设内容进行推送。因此,可以将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容,待推送内容为需要进一步地进行筛选的预设内容。
可以理解的是,待推送内容为最大语义匹配度对应的预设内容,即根据语义匹配预先确定的内容。通过最大语义匹配度筛选待推送内容,能够预先确定最为符合用户意图的预设内容,并大幅缩小需要进一步筛选的预设内容的数量,从而提高信息推送的处理效率。
S360:获取目标用户对应的用户画像和每个待推送内容对应的多个历史用户对应的用户画像。
用户画像为根据用户社会属性、生活习惯或消费行为等用户信息抽象出的一个标签化的用户模型,每个用户画像可以包括多种标签,标签是通过对用户信息分析得来的高度精炼的特征标识。可以通过构建用户画像,获取目标用户对应的用户画像。并对于每个待推送内容,确定该待推送内容对应的历史用户,获取每个历史用户对应的用户画像,历史用户为在指定时间内与该待推送内容发生过交互的用户。其中,指定时间为相对于当前时刻过去的一段时间。例如,历史用户可以是在1个月内点击或者购买过待推送内容对应的产品的用户。
可以理解的是,由于每个用户画像都是由该用户的用户信息得到的,不同用户画像可能具有不同类型或者数量的标签。例如,历史用户A具有标签“男性”、“父亲”、“高消费”和“炒股”这四个标签,历史用户B具有标签“女性”、“白领”和“低消费”这三个标签。
S370:基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定待推送内容的用户兴趣度。
用户兴趣度可以表征该目标用户对待推送内容的感兴趣程度,用户兴趣度越高,表示用户可能更感兴趣,对该待推送内容的推荐程度也越高。由于用户画像可以反映该用户的社会属性、社会习惯或消费行为等特性,可以基于用户画像确定目标用户和历史用户之间的用户相似度,用户相似度越高,表示目标用户和历史用户对待推送内容的用户兴趣度越相近。通过对目标用户对应的用户画像和历史用户对应的用户画像进行分析,可以根据目标用户和历史用户的用户相似度,确定目标用户对每个待推送内容的用户兴趣度。
作为一种方式,可以将每个历史用户对应的用户画像和目标用户对应的用户画像进行匹配,从而得到每个历史用户和目标用户的用户相似度。作为另一种方式,可以由每个待推送内容的多个历史用户对应的用户画像确定一个预测用户画像,即该待推送内容对应的潜在用户群体的用户画像,进而得到该预测用户画像和目标用户对应的用户画像的用户相似度。在获取用户相似度后,根据用户相似度确定待推送内容的用户兴趣度。
在一些实施方式中,可以根据待推送内容的特性生成待推送内容的预设标签,根据预设标签对用户画像进行筛选,得到预设标签相关的标签,将这些标签组成筛选后的用户画像。进而根据筛选后的用户画像计算用户相似度,能够降低计算量,提高相似度计算的准确率。例如,待推送内容的标签为低档产品,则将价格敏感度相关的标签确定为筛选后的用户画像。
S380:根据用户兴趣度对待推送内容进行降序排序,将排序在前的指定数量的待推送内容确定为目标推送内容。
在获取到每个待推送内容的用户兴趣度后,可以根据用户兴趣度对待推送内容进行降序排序,即将用户较为感兴趣的待推送内容排序在前。通过将排序在前的指定数量的待推送内容确定为目标推送内容,能够在待推送内容中确定用户较感兴趣的,较符合用户意图的目标推送内容。其中,指定数量可以为数值阈值对应的数值,也可是小于数值阈值且大于0的自然数,例如,指定数量可以为1,在此不对指定数量进行具体限定。
S390:向目标用户推送目标推送内容。
需要说明的是,前述方法步骤中未详细描述的部分请参阅前述实施例,在此不再赘述。可以理解的是,本实施例中上述的各个步骤,可以均由终端设备在本地进行,也可以均在服务器中进行,还可以由终端设备与服务器分工进行,根据实际应用场景的不同,可以按照需求进行任务的分配,以实现最优化的信息推送,在此并不作限定。
本申请实施例提供的信息推送方法,相较于图2所示的信息推送方法,还包括若第一数量值大于数值阈值,则将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容,从而减少后续分析的计算量,提高计算效率;获取目标用户对应的用户画像和每个待推送内容对应的多个历史用户对应的用户画像,从而得到更抽象的用户信息;基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定待推送内容的用户兴趣度,能够结合待推送内容的历史数据来确定用户兴趣度,从而在当前用户消息基础上,增加了进行比较的信息量,提高了推送的准确率;根据用户兴趣度对待推送内容进行降序排序,将排序在前的指定数量的待推送内容确定为目标推送内容;能够在语义匹配的基础上,结合用户画像中更丰富的用户信息来确定目标推送内容,从而提高了信息推送的准确率。
请参阅图4,图4为本申请一实施例提供的信息推送方法的流程示意图,应用于上述服务器。信息推送方法包括S410至S4100。
S410:获取目标用户输入的用户消息。
S420:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
S430:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
S440:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
S450:若第一数量值大于数值阈值,则将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容。
S460:获取目标用户对应的用户画像和每个待推送内容对应的多个历史用户对应的用户画像。
S470:基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定每个候选推送内容的权重值。
待推送内容包括至少一个候选推送内容,即可以基于目标用户对应的用户画像和每个待推送内容对应的多个历史用户对应的用户画像,根据用户画像之间的相似度从多个待推送内容中确定至少一个候选推送内容,并确定该候选推送内容的权重值。其中,权重值可用于表征对该候选推送内容的推荐程度。
S480:根据权重值,确定每个候选推送内容的用户兴趣度。
在确定每个候选推送内容的权重值后,可以根据权重值确定用户兴趣度。
在一些实施方式中,可以同时采用多种方式并行运算,确定每个方式对应的候选推送内容,即候选推送内容可以包括第一候选内容、第二候选内容、第三候选内容中的至少一项。并行通过多种方式确定候选内容的用户兴趣度,能够更全面地确定目标用户对每个候选推送内容的用户兴趣度。
作为一种方式,当采用一种方式确定候选推送内容时,可以将权重值确定为用户兴趣度。作为另一种方式,当采用多种方式确定候选推送内容时,可以对相同的候选推送内容的权重值进行求和,得到用户兴趣度。其中,各方式的权重值为归一化后的权重值,以使每种方式对用户兴趣度的影响程度是一样的。例如,当第一候选内容为产品A,权重值为0.3,第二候选内容为产品A,权重值为0.5时,可以将产品A的权重值0.8确定为产品A的用户兴趣度。
S490:根据用户兴趣度对待推送内容进行降序排序,将排序在前的指定数量的待推送内容确定为目标推送内容。
根据用户兴趣度对待推送内容进行降序排序,将用户兴趣度高,即目标用户可能更感兴趣的待推送内容排序在前,从而将排序在前的指定数量的待推送内容确定为目标推送内容。指定数量为预先设定的数量值。作为一种方式,指定数量为数值阈值对应的数值。作为另一种方式,指定数量为小于数值阈值且大于0的数值。例如,指定数量可以是1,则将用户兴趣度最高的待推送内容确定为目标推送内容。
S4100:向目标用户推送目标推送内容。
需要说明的是,前述方法步骤中未详细描述的部分请参阅前述实施例,在此不再赘述。可以理解的是,本实施例中上述的各个步骤,可以均由终端设备在本地进行,也可以均在服务器中进行,还可以由终端设备与服务器分工进行,根据实际应用场景的不同,可以按照需求进行任务的分配,以实现最优化的信息推送,在此并不作限定。
本申请实施例提供的信息推送方法,相较于图3所示的信息推送方法,还包括基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定每个候选推送内容的权重值;及根据权重值,确定每个候选推送内容的用户兴趣度。通过目标用户对应的用户画像和历史用户对应的用户画像确定权重值,进而根据权重值确定用户兴趣度,能够更准确地确定目标用户对候选推送内容的用户兴趣度,进而提高信息推送的准确率。
如图5所示,在一些实施方式中,S470可以包括S4710至S4740,其中:
S4710:将多个历史用户对应的用户画像分别和目标用户对应的用户画像进行匹配,得到每个历史用户与目标用户的用户相似度。
对于多个待推送内容的每个历史用户,可以将该历史用户对应的用户画像与目标用户对应的用户画像进行匹配,以得到每个历史用户与目标用户的用户相似度。用户相似度越高,表示历史用户和目标用户越相似。可以理解的是,用户画像反映了用户较为全面的信息,由用户画像得到的用户相似度可以表示两个用户的兴趣度的重合度,相似度越高,该历史用户和当前用户可能感兴趣的内容越相似。
在一些实施方式中,可以将两个用户画像中标签的重合度确定为用户相似度,即重合的标签越多,用户相似度越高。
在一些实施方式中,如图6所示,目标用户对应的用户画像和历史用户对应的用户画像分别包括多个标签,S4710可以包括S4711至S4713,其中:
S4711:融合目标用户对应的用户画像的多个标签的标签特征向量,得到目标用户的目标用户向量。
可以根据预先训练的语义理解模型将每个标签文本映射成对应的标签特征向量,即表征该标签文本语义的向量。通过对用户画像的多个标签特征向量进行融合操作,能够得到包含多个标签特征向量的目标用户向量,目标用户向量可用于表征目标用户的用户信息。其中,融合操作可以是向量的拼接操作或者求和操作。
S4712:融合每个历史用户对应的用户画像的多个标签的标签特征向量,得到每个历史用户的历史用户向量。
得到历史用户的历史用户向量的具体实施方式与得到目标用户的目标用户向量相似,请参阅S4711。
S4713:将多个历史用户向量分别与目标用户向量进行匹配,得到每个历史用户与目标用户的用户相似度。
可以分别对每个历史用户向量和目标用户向量进行匹配操作,得到每个历史用户与目标用户的相似度。作为一种方式,匹配操作可以是计算向量之间的距离,向量之间的距离越大,历史用户和目标用户的用户相似度越低。向量距离可以是欧氏距离、曼哈顿距离、切比雪夫距离或夹角余弦等,在此不做具体限定。通过对目标用户向量和历史用户向量进行向量计算来得到用户相似度,能够提高计算效率,从而改善信息推送的效率。
S4720:确定用户相似度是否大于预设相似度阈值,若是,则判定该历史用户与目标用户匹配。
若用户相似度大于预设相似度阈值,则判定该历史用户与目标用户匹配,即该历史用户与目标用户较为相似;若用户相似度不大于预设相似度阈值,则判定该历史用户与目标用户不匹配。通过对待推送内容的每个历史用户的用户相似度进行判断,能够得到每个历史用户与目标用户的匹配关系。
S4730:获取每个待推送内容的与目标用户匹配的历史用户数量值。
在得到每个历史用户与目标用户的匹配关系后,能够基于该匹配关系得到每个待推送内容的与目标用户匹配的历史用户数量值。历史用户数量为每个待推送内容的多个历史用户中,与目标用户匹配的历史用户的数量。历史用户数量值越大,表征该待推送内容的历史用户中与目标用户相似的用户数量越大,目标用户更可能对该待推送内容感兴趣。
S4740:将最大历史用户数量值对应的待推送内容确定为第一候选内容,并根据最大历史用户数量值确定第一候选内容的权重值。
最大历史用户数量值是从多个历史用户数量值中确定的最大值,可以在确定最大历史用户数量值后将其对应的待推送内容确定为第一候选内容。也就是说,将与目标用户匹配的历史用户最多的待推送内容确定为第一候选内容。
作为一种实施方式,还可以获取每个待推送内容的历史用户的总数量值,根据历史用户数量值和总数量值计算匹配的历史用户百分比,将最大的百分比对应的待推送内容确定为第一候选内容,从而能够减少不同待推送内容的用户基数像差较大所造成的影响。
最大历史用户数量值越大,第一候选内容的权重值越大。作为一种方式,可以将最大历史用户数量值确定为该第一候选内容的权重值。作为另一种方式,可以最大历史用户数量值归一化后确定为权重值。
根据S4710至S4740,能够确定与目标用户所匹配的历史用户数量值,进而将最大历史用户数量值对应的待推送内容确定为候选内容,并确定其权重值,从而提高信息推送的准确率。
如图7所示,在一些实施方式中,S470可以包括S4750至S4760,其中:
S4750:将多个历史用户对应的用户画像分别和目标用户对应的用户画像进行匹配,得到每个历史用户与目标用户的用户相似度。
关于S4750的具体描述请参阅S4710,在此不再赘述。在一些实施方式中,S4750也可以包括S4711至S4713。
S4760:将最大用户相似度对应的待推送内容确定为第二候选内容,并根据最大用户相似度确定第二候选内容的权重值。
在多个历史用户的用户相似度中,确定用户相似度的最大值,将最大用户相似度对应的待推送内容确定为第二候选内容。具体地,根据最大用户相似度能够在多个待推送内容的多个历史用户中,确定与目标用户的相似度最高的历史用户,进而确定该历史用户对应的待推送内容为第二候选内容。可以理解为,将与目标用户最相似的历史用户对应的待推送内容确定为目标推送内容。
在一些实施方式中,一个历史用户可能对应多个待推送内容。例如,一个用户同时购买了多个产品,对于多个产品而言,该用户均被视为历史用户。作为一种方式,可以将多个待推送内容均确定为第二候选内容。作为另一种方式,可以确定历史用户与待推送内容的交互时间,将时间最接近当前的时间的指定数量的待推送内容确定为第二候选内容。作为又一种方式,可以采用S4770至S4790的方式进一步地筛选第二候选内容,具体地,请见后续实施例。
最大用户相似度越大,第二候选内容的权重值越大。作为一种方式,可以将最大用户相似度确定为第二候选内容的权重值。作为另一种方式,可以将归一化后的最大用户相似度确定为权重值。
根据S4750至S4760,能够确定与当前用户的用户相似度最高的历史用户,用户相似度高,表示该历史用户和当前用户感兴趣的内容可能较为相似,从而将该历史用户对应的待推送内容确定为候选内容,使得推送的内容更符合用户的意图。特别是在历史用户的数量较小的情况下,能够提高信息推送的准确率。
如图8所示,在一些实施方式中,S470可以包括S4770至S4790,其中:
S4770:根据每个待推送内容的多个历史用户对应的用户画像,确定每个待推送内容对应的一个预测用户画像。
预测用户画像为根据每个待推送内容的多个历史用户对应的真实的用户画像,得到的抽象的非真实的用户画像,反映该待推送内容的潜在用户的用户特性。在此不对获取预测用户画像的方式进行限定。
作为一种实施方式,预测用户画像可以是通过对多个历史用户对应的用户画像进行数理统计得到的,即得到可解释的标签。例如,对于每个标签类别,统计相同的各标签的数量,将最大值的标签作为预测用户画像的标签。
作为又一种方式,预测用户画像可以是基于预先训练的机器学习模型,将历史用户对应的用户画像的数据作为输入,得到的输出结果。例如,预测用户画像可以是对用户画像中的多个标签进行聚类,得到的最大的簇的标签。
S4780:将每个待推送内容对应的预测用户画像分别与目标用户对应的用户画像进行匹配,得到每个预测用户画像与目标用户对应的用户画像的用户相似度。
获取用户相似度的具体实施方式与S4710类似,在此不再赘述。
S4790:将最大用户相似度对应的待推送内容确定为第三候选内容,并根据最大用户相似度确定第三候选内容的权重值。
最大用户相似度为多个用户相似度中的最大值,将最大用户相似度对应的待推送内容确定为第三候选内容。最大用户相似度越大,第三候选内容的权重值越大。作为一种方式,可以将最大用户相似度确定为第三候选内容的权重值。作为另一种方式,可以将归一化后的最大用户相似度确定为权重值。
根据S4770至S4790,能够先确定待推送内容对应的预测用户画像,目标用户的用户画像只需要与预测用户画像进行匹配,极大地提高了匹配效率,从而改善了信息推送的效率。
请参阅图9,图9为本申请一实施例提供的信息推送方法的流程示意图,应用于上述服务器。信息推送方法包括S510至S5120。
S510:获取目标用户输入的用户消息。
S520:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
S530:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
S540:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
S550:若第一数量值大于数值阈值,则将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容。
S560:获取目标用户对应的用户画像和每个待推送内容对应的多个历史用户对应的用户画像。
S570:基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定每个候选推送内容的权重值。
S580:获取用户消息的输入时间,根据输入时间确定权重值的时间系数。
输入时间可以是终端设备获取到用户消息的时间,可以根据输入时间确定该用户消息的时间系数,即权重值的时间系数,时间系数随着输入时间与当前时刻的时间间隔增大而减小。
如图10所示,在一些实施方式中,在获取用户消息的输入时间前,信息推送方法还可以包括步骤S581至S583,其中:
S581:获取不同的候选推送内容的第二数量值。
确定不同的候选推送内容,即预设内容的数量,得到第二数量值。在一些实施方式中,当候选推送内容包括第一候选内容,第二候选内容和第三候选内容中的多项时,可以将不同的预设内容的数量确定为第二数量值。例如,第一候选内容为产品A,第二候选内容为产品A,第三候选内容为产品B,则第二数量值为2。
S582:确定第二数量值是否不大于数值阈值,若是,则将每个候选推送内容的权重值的和确定为该候选推送内容的用户兴趣度,将候选推送内容确定为目标推送内容。
若第二数量值不大于数值阈值,则将每个候选推送内容的权重值的和确定为该候选推送内容的用户兴趣度,将候选推送内容确定为目标推送内容。
S583:若否,则获取用户消息的输入时间。
若第二数量值不大于数值阈值,则获取用户消息的输入时间,根据输入时间确定所述用户消息的时间系数。
S590:获取目标用户的历史数据。
其中,历史数据包括由多个历史用户消息得到的每个候选推送内容的权重值和该权重值的时间系数。历史用户消息为目标用户在过去输入的用户消息;权重值可以是由该候选推送内容对应的语义匹配度得到的,也可以是由用户画像得到的权重值。时间系数可以是根据历史用户消息的输入时间确定的系数,时间系数随着该用户消息的输入时间距离当前时刻的时间间隔增大而减小。可以理解的是,历史用户消息的候选推送内容并不一定是被作为目标推送内容进行过推送的内容。
在一些实施方式中,历史用户消息的时间系数与该候选推送内容有关。例如,历史用户消息的时间系数可以是当前用户的消息的时间系数乘以时间衰减系数,时间衰减系数用于表征时间系数随时间的衰减程度。对于需要长时间考虑决策的候选推送内容,其时间衰减系数较小,历史的数据相对更为重要,对于其他的候选推送内容,其时间衰减系数较大,更多地考虑当前时刻的数据。例如,候选推送内容为房子等需要较长时间转化成交的产品和生鲜等可以快速成交的产品,则房子的时间衰减系数小于生鲜的时间衰减系数。
S5100:对每个权重值和时间系数的乘积进行求和处理,得到候选推送内容的用户兴趣度。
对每个候选推送内容,可以得到至少一个权重值和每个权重值对应的时间系数,进而对每个权重值和时间系数的乘积进行求和处理,得到候选推送内容的用户兴趣度。从而在计算用户兴趣度时,能够考虑用户历史行为的影响。
例如,对于候选推送内容产品A,10天前的历史用户消息对应的权重值为0.5,时间系数为0.2,5天前的历史用户消息对应的权重值为0.6,时间系数为0.4,当前输入的用户消息对应的权重值为0.8,时间系数为1,则产品A的用户兴趣度为0.5×0.2+0.6×0.4+0.8×1。
S5110:根据用户兴趣度对待推送内容进行降序排序,将排序在前的指定数量的待推送内容确定为目标推送内容。
S5120:向目标用户推送目标推送内容。
需要说明的是,前述方法步骤中未详细描述的部分请参阅前述实施例,在此不再赘述。可以理解的是,本实施例中上述的各个步骤,可以均由终端设备在本地进行,也可以均在服务器中进行,还可以由终端设备与服务器分工进行,根据实际应用场景的不同,可以按照需求进行任务的分配,以实现最优化的信息推送,在此并不作限定。
本申请实施例提供的信息推送方法,相较于图4所示的信息推送方法,还包括获取用户消息的输入时间,根据输入时间确定权重值的时间系数;获取目标用户的历史数据,历史数据包括由多个历史用户消息得到的每个候选推送内容的权重值和该权重值的时间系数;及对每个权重值和时间系数的乘积进行求和处理,得到候选推送内容的用户兴趣度。能够结合目标用户当前输入的用户消息和其历史行为,考虑到随时间转移的用户兴趣,能够使信息推送更加准确。
请参阅图11,图11为本申请一实施例提供的信息推送方法的流程示意图,应用于上述服务器。信息推送方法包括S610至S680。
S610:获取目标用户输入的用户消息。
S620:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
S630:获取用户消息的输入时间。
获取目标用户输入用户消息的输入时间,输入时间可以是终端设备获取到用户消息的时间。
S640:将每个预设内容的语义匹配度进行归一化处理,得到每个预设内容的权重值。
可以在获取语义匹配度后,对每个预设内容的语义匹配度进行归一化的处理,将归一化后的语义匹配度确定为该预设内容的权重值,从而使权重值为标准的数据格式。
S650:将每个预设内容的权重值和输入时间保存为目标用户的历史数据。
将每个预设内容的权重值和输入时间保存为目标用户的历史数据。可选地,可以仅将权重值大于预设阈值,即语义匹配度较大的预设内容进行保存操作,以节省存储空间。通过保存历史数据,可以为确定目标推送内容提供历史数据,以更准确地确定目标推送内容,也可以根据历史数据进一步地通过外呼机器人、人工客服等方式使预设内容触达该目标用户。
S630至S650的执行顺序并不限于当前列举的顺序,仅要求在执行S620之后执行本步骤即可,例如本步骤还可以在执行S680之后执行等。
S660:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
S670:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
S680:向目标用户推送目标推送内容。
需要说明的是,前述方法步骤中未详细描述的部分请参阅前述实施例,在此不再赘述。
本申请实施例提供的信息推送方法,相较于图2所示的信息推送方法,还包括获取用户消息的输入时间,根据输入时间确定用户消息的时间系数;将每个预设内容的语义匹配度进行归一化处理,得到每个预设内容的权重值;将每个预设内容的权重值和时间系数保存为目标用户的历史数据;能够将用户消息的时间系数和其对应的预设内容的权重值保存为历史数据,从而为信息推送提供了数据支持,能够根据历史数据确定推送内容。
请参阅图12,图12为本申请一实施例提供的信息推送方法的流程示意图,应用于上述服务器。信息推送方法包括S710至S790。
S710:获取预设内容和预设内容对应的对话数据。
预设内容为用于被推送的内容,预设内容可以是多模态的形式。作为一种方式,预设内容可以是根据实体设置的多模态内容。例如,实体为生鲜超市,预设内容为“生鲜超市,极速送货上门”等。
对话数据为预设的与该预设内容相关的文本数据。对话数据可以包括多个常见问答对和多个任务型对话。其中,每个常见问答对可以包括一个问题文本和该问题文本对应的答案文本,任务型多轮对话包括澄清需求、引导用户、询问、确认、对话结束语等一系列的多个问题文本和每个问题文本对应的答案文本。
对话数据还可以包括输入每个文本的对象身份,例如,对象身份可以表示一句话是由用户输入还是客服输入的。作为一种方式,问题文本可以是对话数据中,由用户输入的用户消息的文本。
S720:拆分对话数据得到多个问答文本。
可以将对话数据拆分为多个问答文本。具体地,对于常见问答对,可以得到每个问题文本和每个答案文本;对于任务型多轮对话,可以将其拆分为多个问答对,进而得到每个问题文本和每个答案文本。问答文本可以仅包括问题文本,也可以包括问题文本和答案文本。作为一种方式,可以在得到多个问答文本后,进一步地对问答文本进行筛选,将无意义的文本或者闲聊文本从中剔除,以减少问答文本的数量。作为一种方式,还可以拆分对话数据得到问答文本后,将问答文本更新为其对应的标准问题文本和标准答案文本。
S730:将公共知识库中与多个问答文本相同的文本确定为预设内容对应的第一匹配文本。
知识库包括公共知识库和专有知识库,知识库中包括多个匹配文本。其中,每个专有知识库对应每个预设内容,公共知识库对应于多个预设内容,公共知识库中的每个文本与预设内容的对应关系也被保存在服务器中。
可以在公共知识库中查找是否存在与问答文本相同的文本,若是,则将相同的文本确定为预设内容对应的第一匹配文本,并存储该文本与预设内容的对应关系。其中,相同可以表示文本相同,也可以表示语义相同。
在一些实施方式中,还可以将该预设内容对应的问答文本与其他预设内容的专有知识库中的文本进行比对,若存在相同的文本,则将该文本添加至公共知识库中,并记录与该文本对应的预设内容,从而节省存储空间。
S740:将第一匹配文本以外的多个问答文本确定为预设内容对应的第二匹配文本,添加第二匹配文本至预设内容的专有知识库。
在确定第一匹配文本后,可以将第一匹配文本以外的多个问答文本确定为预设内容对应的第二匹配文本,建立预设内容的专有知识库,并将第二文本添加至预设内容的专有知识库中。
S710至S730的执行顺序并不限于当前列举的顺序,仅要求在执行S760之前执行本步骤即可。
S750:获取目标用户输入的用户消息。
S760:将知识库中的多个匹配文本分别与用户消息进行匹配,获取多个语义匹配度,每个匹配文本对应至少一个预设内容。
S770:确定多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若最大语义匹配度大于匹配阈值,则确定最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值。
S780:确定第一数量值是否不大于数值阈值,若第一数量值不大于数值阈值,则将最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容。
S790:向目标用户推送目标推送内容。
需要说明的是,前述方法步骤中未详细描述的部分请参阅前述实施例,在此不再赘述。可以理解的是,本实施例中上述的各个步骤,可以均由终端设备在本地进行,也可以均在服务器中进行,还可以由终端设备与服务器分工进行,根据实际应用场景的不同,可以按照需求进行任务的分配,以实现最优化的信息推送,在此并不作限定。
本申请实施例提供的信息推送方法,相较于图2所示的信息推送方法,还包括获取预设内容和预设内容对应的对话数据;拆分对话数据得到多个问答文本;将公共知识库中与多个问答文本相同的文本确定为预设内容对应的第一匹配文本;及将第一匹配文本以外的多个问答文本确定为预设内容对应的第二匹配文本,添加第二匹配文本至预设内容的专有知识库;能够根据预设内容建立存储问答文本的知识库,通过构建公共知识库和专有知识库能够节省存储空间。
可以理解的是,上述示例仅为本申请实施例提供的方法在一种具体场景进行应用的示意性说明,并不对本申请实施例构成限定。基于本申请实施例提供的方法还可实现更多不同的应用。
请参阅图13,图13示出了本申请一实施例提供的一种信息推送装置的结构框图。下面将针对图13所示的结构框图进行阐述,信息推送装置800包括:消息获取模块810、语义匹配模块820、匹配度判断模块830、第一数量值判断模块840和信息推送模块850。其中,消息获取模块810,用于获取目标用户输入的用户消息;语义匹配模块820,用于将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度,每个所述匹配文本对应至少一个预设内容;匹配度判断模块830,用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个所述预设内容的第一数量值;第一数量值判断模块840,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及信息推送模块850,用于向所述目标用户推送所述目标推送内容。
进一步地,所述信息推送装置800还包括时间系数确定模块、归一化处理模块以及历史数据保存模块。其中,所述时间确定模块,用于获取所述用户消息的输入时间;所述归一化处理模块,用于将每个所述预设内容的所述语义匹配度进行归一化处理,得到每个所述预设内容的权重值;及所述历史数据保存模块,用于将每个所述预设内容的所述权重值和所述输入时间保存为所述目标用户的历史数据。
进一步地,所述知识库包括公共知识库和专有知识库,所述匹配文本包括第一匹配文本和第二匹配文本,所述信息推送装置800还包括:对话数据获取模块、问答文本获取模块、第一匹配文本确定模块,以及第二匹配文本确定模块。其中,所述对话数据获取模块,用于在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之前,获取所述预设内容和所述预设内容对应的对话数据;所述问答文本获取模块,用于拆分所述对话数据得到多个问答文本;所述第一匹配文本确定模块,用于将公共知识库中与所述多个问答文本相同的文本确定为所述预设内容对应的所述第一匹配文本;及所述第二匹配文本确定模块,用于将所述第一匹配文本以外的所述多个问答文本确定为所述预设内容对应的所述第二匹配文本,添加所述第二匹配文本至所述预设内容的专有知识库。
进一步地,所述第一数量值判断模块840包括:待推送内容确定子模块、用户画像获取子模块、用户兴趣度确定子模块以及排序子模块;其中,所述待推送内容确定子模块,用于若所述第一数量值大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容;用户画像获取子模块,用于获取所述目标用户对应的用户画像和每个所述待推送内容对应的多个历史用户对应的用户画像;用户兴趣度确定子模块,用于基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度;及排序子模块,用于根据所述用户兴趣度对所述待推送内容进行降序排序,将排序在前的指定数量的所述待推送内容确定为所述目标推送内容。
进一步地,所述待推送内容包至少一个候选推送内容,所述用户兴趣度确定子模块包括:权重值确定单元和兴趣度确定单元,其中,所述权重值确定单元用于基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值;及所述兴趣度确定单元,用于根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度。
进一步地,所述权重值确定单元包括:第一用户相似度确定子单元,相似度阈值判断子单元,历史用户数量值获取子单元以及第一候选内容确定子单元,其中,第一用户相似度确定子单元,用于将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;相似度阈值判断子单元,用于确定所述用户相似度是否大于预设相似度阈值,若是,则判定该历史用户与所述目标用户匹配;历史用户数量值获取子单元,用于获取每个所述待推送内容的与所述目标用户匹配的历史用户数量值;及第一候选内容确定子单元,用于将最大历史用户数量值对应的待推送内容确定为第一候选内容,并根据所述最大历史用户数量值确定所述第一候选内容的权重值
进一步地,所述权重值确定单元包括:第一用户相似度确定子单元以及第二候选内容确定子单元,其中,所述第一用户相似度确定子单元,用于将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;及所述第二候选内容确定子单元,用于将最大用户相似度对应的待推送内容确定为第二候选内容,并根据所述最大用户相似度确定所述第二候选内容的权重值。
进一步地,所述目标用户对应的用户画像和所述历史用户对应的用户画像分别包括多个标签,所述第一用户相似度确定子单元,包括第一向量融合次子单元、第二向量融合次子单元以及向量匹配次子单元。其中,第一向量融合次子单元,用于融合所述目标用户对应的用户画像的所述多个标签的标签特征向量,得到所述目标用户的目标用户向量;第二向量融合次子单元,用于融合每个所述历史用户对应的用户画像的所述多个标签的标签特征向量,得到每个所述历史用户的历史用户向量;及向量匹配次子单元,用于将多个所述历史用户向量分别与所述目标用户向量进行匹配,得到每个所述历史用户与所述目标用户的所述用户相似度。
进一步地,所述权重值确定单元包括:预测用户画像确定子单元、第二用户相似度确定子单元以及第三候选内容确定子单元。其中,所述预测用户画像确定子单元,用于根据每个所述待推送内容的多个所述历史用户对应的用户画像,确定每个所述待推送内容对应的一个预测用户画像;所述第二用户相似度确定子单元,用于将每个所述待推送内容对应的所述预测用户画像分别与所述目标用户对应的用户画像进行匹配,得到每个所述预测用户画像与所述目标用户对应的用户画像的用户相似度;及所述第三候选内容确定子单元,用于将最大用户相似度对应的待推送内容确定为第三候选内容,并根据所述最大用户相似度确定所述第三候选内容的权重值。
进一步地,所述兴趣度确定单元包括:时间系数确定子单元、历史数据获取子单元以及求和处理子单元。其中,所述时间系数确定子单元,用于获取所述用户消息的输入时间,根据所述输入时间确定所述权重值的时间系数;所述历史数据获取子单元,用于获取所述目标用户的历史数据,所述历史数据包括由多个历史用户消息得到的每个所述候选推送内容的权重值和该权重值的时间系数;及所述求和处理子单元,用于对每个所述权重值和所述时间系数的乘积进行求和处理,得到所述候选推送内容的所述用户兴趣度。
进一步地,所述兴趣度确定单元还包括:第二数量值获取子单元、第二数量值判断子单元以及时间系数获取子单元。其中,所述第二数量值获取子单元,用于在所述获取所述用户消息的输入时间之前,获取不同的所述候选推送内容的第二数量值;第二数量值判断子单元,用于确定所述第二数量值是否不大于所述数值阈值,若是,则将每个所述候选推送内容的所述权重值的和确定为该候选推送内容的所述用户兴趣度,将所述候选推送内容确定为所述目标推送内容;及所述时间系数获取子单元,用于若否,则获取所述用户消息的所述输入时间。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
请参阅图14,图14示出了本申请一实施例提供的一种信息推送系统的结构框图。下面将针对图14所示的结构框图进行阐述,所述信息推送系统900包括知识库单元910、对话单元920和推送单元930;其中,所述对话单元920,用于获取目标用户输入的用户消息,识别所述用户消息的语义信息;所述推送单元930,用于从所述对话单元920获取所述语义信息,从所述知识库单元910获取多个匹配文本,每个所述匹配文本对应至少一个预设内容;所述推送单元930,用于将所述多个匹配文本分别与所述语义信息进行匹配,获取多个语义匹配度;所述推送单元930用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;所述推送单元930,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则从所述知识库单元910获取所述最大语义匹配度的匹配文本对应的至少一个预设内容,将该至少一个预设内容确定为目标推送内容;及所述推送单元930,用于向所述目标用户推送所述目标推送内容。
请参阅图15,图15示出了本申请一实施例提供的一种信息推送系统的示意图。知识库单元910可以预先新建产品并建立产品对应的预设内容,并进一步地针对产品创建知识库,知识库包括每个产品对应的至少一个待匹配文本。即构建知识库后,由知识库可以得到预设内容和待匹配文本的对应关系。当目标用户基于对话界面进行交互时,对话单元920获取目标用户输入的用户消息,并识别用户消息对应的语义信息,将语义信息发送至推送单元930。推送单元930可以从知识库单元910获取多个匹配文本,根据多个匹配文本和语义信息确定目标推送内容,将目标推送内容发送至推送单元930;推送单元930,用于向目标用户推送目标推送内容。
其中,推送单元930还用于若第一数量值大于数值阈值,则将最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容;获取目标用户对应的用户画像和每个待推送内容对应的多个历史用户的用户画像;基于目标用户对应的用户画像和多个历史用户对应的用户画像,确定待推送内容的用户兴趣度;及根据用户兴趣度对待推送内容进行降序排序,将排序在前的指定数量的待推送内容确定为目标推送内容。在一些实施方式中,推送单元930还可以将目标推送内容和目标用户的用户信息存储为商机信息。
将信息推送系统900划分为知识库单元910、对话单元920和推送单元930。各个单元也可以理解为子系统,可以是由各个服务器实现的。知识库单元910用于关联物料,即产品的预设内容和匹配文本等,对话单元920用于管理与用户的对话过程,推送单元用于确定目标推送内容,各司其职的功能划分实现了系统的高内聚低耦合的特性,当系统出问题可以快速定位问题,在需要维护和替换也可以对某一单元进行,效率比较高。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述系统和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
请参考图16,其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备1000可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备1000可以包括一个或多个如下部件:处理器1010、存储器1020以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器1020中并被配置为由一个或多个处理器1010执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
处理器1010可以包括一个或者多个处理核。处理器1010利用各种接口和线路连接整个电子设备1000内的各个部分,通过运行或执行存储在存储器1020内的指令、程序、代码集或指令集,以及调用存储在存储器1020内的数据,执行电子设备1000的各种功能和处理数据。可选地,处理器1010可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器1010可集成中央处理器(Central Processing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1010中,单独通过一块通信芯片进行实现。
存储器1020可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器1020可用于存储指令、程序、代码、代码集或指令集。存储器1020可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备1000在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参阅图17,其示出了本申请实施例提供的一种计算机可读取存储介质的结构框图。该计算机可读取存储介质1100中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读取存储介质1100可以是诸如闪存、电可擦除可编程只读存储器(electrically-erasable programmable read-only memory,EEPROM)、可擦除可编程只读存储器(erasable programmable read only memory,EPROM)、硬盘或者ROM之类的电子存储器。可选地,计算机可读取存储介质1100包括非易失性计算机可读介质(non-transitorycomputer-readable storage medium)。计算机可读取存储介质1100具有执行上述方法中的任何方法步骤的程序代码1110的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1110可以例如以适当形式进行压缩。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (15)
1.一种信息推送方法,其特征在于,所述方法包括:
获取目标用户输入的用户消息;
将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度,每个所述匹配文本对应至少一个预设内容;
确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个所述预设内容的第一数量值;
确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及
向所述目标用户推送所述目标推送内容。
2.根据权利要求1所述的信息推送方法,其特征在于,所述方法还包括:
若所述第一数量值大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的每个预设内容确定为待推送内容;
获取所述目标用户对应的用户画像和每个所述待推送内容对应的多个历史用户对应的用户画像;
基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度;及
根据所述用户兴趣度对所述待推送内容进行降序排序,将排序在前的指定数量的所述待推送内容确定为所述目标推送内容。
3.根据权利要求2所述的方法,其特征在于,所述待推送内容包括至少一个候选推送内容,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定所述待推送内容的用户兴趣度,包括:
基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值;及
根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度。
4.根据权利要求3所述的信息推送方法,其特征在于,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:
将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;
确定所述用户相似度是否大于预设相似度阈值,若是,则判定该历史用户与所述目标用户匹配;
获取每个所述待推送内容的与所述目标用户匹配的历史用户数量值;及
将最大历史用户数量值对应的待推送内容确定为第一候选内容,并根据所述最大历史用户数量值确定所述第一候选内容的权重值。
5.根据权利要求3所述的信息推送方法,其特征在于,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:
将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度;及
将最大用户相似度对应的待推送内容确定为第二候选内容,并根据所述最大用户相似度确定所述第二候选内容的权重值。
6.根据权利要求4或5所述的信息推送方法,其特征在于,所述目标用户对应的用户画像和所述历史用户对应的用户画像分别包括多个标签,所述将多个所述历史用户对应的用户画像分别和所述目标用户对应的用户画像进行匹配,得到每个所述历史用户与所述目标用户的用户相似度,包括:
融合所述目标用户对应的用户画像的所述多个标签的标签特征向量,得到所述目标用户的目标用户向量;
融合每个所述历史用户对应的用户画像的所述多个标签的标签特征向量,得到每个所述历史用户的历史用户向量;及
将多个所述历史用户向量分别与所述目标用户向量进行匹配,得到每个所述历史用户与所述目标用户的所述用户相似度。
7.根据权利要求3所述的信息推送方法,其特征在于,所述基于所述目标用户对应的用户画像和多个所述历史用户对应的用户画像,确定每个所述候选推送内容的权重值,包括:
根据每个所述待推送内容的多个所述历史用户对应的用户画像,确定每个所述待推送内容对应的一个预测用户画像;
将每个所述待推送内容对应的所述预测用户画像分别与所述目标用户对应的用户画像进行匹配,得到每个所述预测用户画像与所述目标用户对应的用户画像的用户相似度;及
将最大用户相似度对应的待推送内容确定为第三候选内容,并根据所述最大用户相似度确定所述第三候选内容的权重值。
8.根据权利要求3所述的方法,其特征在于,所述根据所述权重值,确定每个所述候选推送内容的所述用户兴趣度,包括:
获取所述用户消息的输入时间,根据所述输入时间确定所述权重值的时间系数;
获取所述目标用户的历史数据,所述历史数据包括由多个历史用户消息得到的每个所述候选推送内容的权重值和该权重值的时间系数;及
对每个所述权重值和所述时间系数的乘积进行求和处理,得到所述候选推送内容的所述用户兴趣度。
9.根据权利要求8所述的方法,其特征在于,在所述获取所述用户消息的输入时间之前,所述方法还包括:
获取不同的所述候选推送内容的第二数量值;
确定所述第二数量值是否不大于所述数值阈值,若是,则将每个所述候选推送内容的所述权重值的和确定为该候选推送内容的所述用户兴趣度,将所述候选推送内容确定为所述目标推送内容;及
若否,则获取所述用户消息的所述输入时间。
10.根据权利要求1所述的方法,其特征在于,在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之后,所述方法还包括:
获取所述用户消息的输入时间;
将每个所述预设内容的所述语义匹配度进行归一化处理,得到每个所述预设内容的权重值;及
将每个所述预设内容的所述权重值和所述输入时间保存为所述目标用户的历史数据。
11.根据权利要求1所述的方法,其特征在于,所述知识库包括公共知识库和专有知识库,所述匹配文本包括第一匹配文本和第二匹配文本,在所述将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度之前,所述方法还包括:
获取所述预设内容和所述预设内容对应的对话数据;
拆分所述对话数据得到多个问答文本;
将公共知识库中与所述多个问答文本相同的文本确定为所述预设内容对应的所述第一匹配文本;及
将所述第一匹配文本以外的所述多个问答文本确定为所述预设内容对应的所述第二匹配文本,添加所述第二匹配文本至所述预设内容的专有知识库。
12.一种信息推送装置,其特征在于,包括:
消息获取模块,用于获取目标用户输入的用户消息;
语义匹配模块,用于将知识库中的多个匹配文本分别与所述用户消息进行匹配,获取多个语义匹配度,每个所述匹配文本对应至少一个预设内容;
匹配度判断模块,用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个所述预设内容的第一数量值;
第一数量值判断模块,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则将所述最大语义匹配度的匹配文本对应的至少一个预设内容确定为目标推送内容;及
信息推送模块,用于向所述目标用户推送所述目标推送内容。
13.一种信息推送系统,其特征在于,所述信息推送系统包括知识库单元、对话单元和推送单元;
所述对话单元,用于获取目标用户输入的用户消息,识别所述用户消息的语义信息;
所述推送单元,用于从所述对话单元获取所述语义信息,从所述知识库单元获取多个匹配文本,每个所述匹配文本对应至少一个预设内容;
所述推送单元,用于将所述多个匹配文本分别与所述语义信息进行匹配,获取多个语义匹配度;
所述推送单元,用于确定所述多个语义匹配度中的最大语义匹配度是否大于匹配阈值,若所述最大语义匹配度大于所述匹配阈值,则确定所述最大语义匹配度的匹配文本对应的至少一个预设内容的第一数量值;
所述推送单元,用于确定所述第一数量值是否不大于数值阈值,若所述第一数量值不大于所述数值阈值,则从所述知识库单元获取所述最大语义匹配度的匹配文本对应的至少一个预设内容,将该至少一个预设内容确定为目标推送内容;及
所述推送单元,用于向所述目标用户推送所述目标推送内容。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行如权利要求1-11中任意一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-11中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110825589.9A CN113516515B (zh) | 2021-07-21 | 2021-07-21 | 信息推送方法、装置、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110825589.9A CN113516515B (zh) | 2021-07-21 | 2021-07-21 | 信息推送方法、装置、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113516515A CN113516515A (zh) | 2021-10-19 |
CN113516515B true CN113516515B (zh) | 2024-02-27 |
Family
ID=78068525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110825589.9A Active CN113516515B (zh) | 2021-07-21 | 2021-07-21 | 信息推送方法、装置、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113516515B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220380A (zh) * | 2017-06-27 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的问答推荐方法、装置和计算机设备 |
CN107526807A (zh) * | 2017-08-22 | 2017-12-29 | 中国联合网络通信集团有限公司 | 信息推荐方法及装置 |
CN109766013A (zh) * | 2018-12-28 | 2019-05-17 | 北京金山安全软件有限公司 | 诗词语句输入推荐方法、装置和电子设备 |
WO2020006835A1 (zh) * | 2018-07-03 | 2020-01-09 | 平安科技(深圳)有限公司 | 智能客服多轮问答方法、设备、存储介质及装置 |
CN113111264A (zh) * | 2021-06-15 | 2021-07-13 | 深圳追一科技有限公司 | 界面内容显示方法、装置、电子设备及存储介质 |
CN113127621A (zh) * | 2021-04-28 | 2021-07-16 | 平安国际智慧城市科技股份有限公司 | 对话模块的推送方法、装置、设备及存储介质 |
-
2021
- 2021-07-21 CN CN202110825589.9A patent/CN113516515B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220380A (zh) * | 2017-06-27 | 2017-09-29 | 北京百度网讯科技有限公司 | 基于人工智能的问答推荐方法、装置和计算机设备 |
CN107526807A (zh) * | 2017-08-22 | 2017-12-29 | 中国联合网络通信集团有限公司 | 信息推荐方法及装置 |
WO2020006835A1 (zh) * | 2018-07-03 | 2020-01-09 | 平安科技(深圳)有限公司 | 智能客服多轮问答方法、设备、存储介质及装置 |
CN109766013A (zh) * | 2018-12-28 | 2019-05-17 | 北京金山安全软件有限公司 | 诗词语句输入推荐方法、装置和电子设备 |
CN113127621A (zh) * | 2021-04-28 | 2021-07-16 | 平安国际智慧城市科技股份有限公司 | 对话模块的推送方法、装置、设备及存储介质 |
CN113111264A (zh) * | 2021-06-15 | 2021-07-13 | 深圳追一科技有限公司 | 界面内容显示方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
赵小虎 ; 赵成龙 ; .基于多特征语义匹配的知识库问答系统.计算机应用.2020,(07),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN113516515A (zh) | 2021-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444428B (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN111641514B (zh) | 会议智能系统、用于会议智能的方法和存储介质 | |
US9959467B2 (en) | Image processing client | |
CN110020009B (zh) | 在线问答方法、装置及系统 | |
CN114357973B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN112733042B (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
KR20180022762A (ko) | 실시간 답변 메시지 생성을 이용한 고객 상담 서비스 제공 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
CN108268450B (zh) | 用于生成信息的方法和装置 | |
CN111985249A (zh) | 语义分析方法、装置、计算机可读存储介质及电子设备 | |
CN110765294B (zh) | 图像搜索方法、装置、终端设备及存储介质 | |
US20190095951A1 (en) | Image Processing Methods | |
KR102322668B1 (ko) | 콘텐츠 크리에이터의 창작활동 활성화를 위한 다중 플랫폼 서비스 제공 시스템 | |
US20220358552A1 (en) | Methods and systems for hair-service based digital image searching and ranking | |
CN113111264B (zh) | 界面内容显示方法、装置、电子设备及存储介质 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
CN111475632A (zh) | 问句处理方法、装置、电子设备及存储介质 | |
CN113051380A (zh) | 信息生成方法、装置、电子设备和存储介质 | |
KR20180049277A (ko) | 채팅 사용자 플랫폼을 이용한 비대면 상품 추천 방법 및 장치 | |
CN112214667B (zh) | 基于三维模型的信息推送方法、装置、设备及存储介质 | |
US11373057B2 (en) | Artificial intelligence driven image retrieval | |
CN116703515A (zh) | 基于人工智能的推荐方法、装置、计算机设备及存储介质 | |
CN113516515B (zh) | 信息推送方法、装置、系统、电子设备及存储介质 | |
CN111400464B (zh) | 一种文本生成方法、装置、服务器及存储介质 | |
CN113505292A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
KR102322212B1 (ko) | 학습 콘텐츠 추천 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |