CN116521822A - 基于5g消息多轮会话机制的用户意图识别方法和装置 - Google Patents
基于5g消息多轮会话机制的用户意图识别方法和装置 Download PDFInfo
- Publication number
- CN116521822A CN116521822A CN202310250895.3A CN202310250895A CN116521822A CN 116521822 A CN116521822 A CN 116521822A CN 202310250895 A CN202310250895 A CN 202310250895A CN 116521822 A CN116521822 A CN 116521822A
- Authority
- CN
- China
- Prior art keywords
- text
- user
- information
- message
- corrected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000007246 mechanism Effects 0.000 title claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 144
- 230000003068 static effect Effects 0.000 claims abstract description 46
- 230000003993 interaction Effects 0.000 claims abstract description 35
- 230000008569 process Effects 0.000 claims abstract description 18
- 230000006399 behavior Effects 0.000 claims description 24
- 238000012937 correction Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000009471 action Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000004781 supercooling Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于5G消息多轮会话机制的用户意图识别方法和装置。方法包括:获取5G消息终端采集的历史5G消息,以基于历史5G消息指示的目标用户的历史交互行为确定目标用户的静态初始用户画像;根据静态初始用户画像,在内容数据库中确定第一推送消息,并推送至目标用户;根据接收到的目标用户针对第一推送消息的修正文本,确定修正文本的文本向量;根据修正文本的文本向量,确定用户意图信息;根据用户意图信息、第一推送消息和修正文本,对静态初始用户画像进行修正,获取修正用户画像;迭代执行获取修正用户画像的处理,获得目标用户画像,目标用户画像用于描述目标用户的意图。通过本方法提高了用户意图确定的准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于5G消息多轮会话机制的用户意图识别方法和装置。
背景技术
当前一部分传统短信业务升级到了富媒体消息业务,即5G消息业务。5G消息支持丰富的媒体格式,包括文本、图片和音视频等。相关业务分为两大类:一是个人用户和个人用户之间的交互消息,另一个是行业客户与个人用户之间的交互消息。
面向个人用户,5G消息提供点到点消息和群聊服务,消息内容除文本外,还可以支持图片、音频、视频、位置、联系人等多种形式。用户无需下载客户端,无需添加好友,就能收发其他手机号用户的5G消息。
面向行业客户,5G消息提供增强的个人与应用间消息服务,实现“消息即服务”,并且引入了新的消息交互模式——Chatbot聊天机器人,大家可以在消息窗口直观便捷地享受缴费充值、票务订购、酒店预订、物流查询、餐饮订座、外卖下单等各类5G应用服务。
综上,5G消息相较于传统短信业务是体验与服务的升级和革新,可以满足更高品质、更丰富多彩的信息通信需求,承载和衍生出更多样的5G应用服务。
相关技术中,在5G消息体内,无法精准确定用户意图。
公开于本申请背景技术部分的信息仅仅旨在加深对本申请的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明所要解决的问题是提出能够基于用户的修正文本,准确理解用户意图,并更新用户画像。
本发明提供一种基于5G消息多轮会话机制的用户意图识别方法和装置。
本发明提供一种基于5G消息多轮会话机制的用户意图识别方法,包括:
获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
根据所述修正文本的所述文本向量,确定用户意图信息;
根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
根据本发明的一些实施例,获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像,包括:
根据所述历史浏览记录的输入信息,获得浏览实体特征信息;
根据所述历史浏览记录的点击信息,和/或所述输入信息的语义信息,获得浏览偏好特征信息;
根据历史推送记录,获得推送频率特征信息;
根据所述浏览实体特征信息、所述浏览偏好特征信息和所述推送频率特征信息,获得所述静态初始用户画像。
根据本发明的一些实施例,根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量,包括:
对所述修正文本进行预处理,获得标准化的修正文本;
根据所述标准化的修正文本,确定所述修正文本的文本向量。
根据本发明的一些实施例,根据所述修正文本的所述文本向量,确定用户意图信息,包括:
根据所述文本向量,获取所述标准化的修正文本中的重要单词信息;
对所述重要单词信息进行分类,获得用户意图信息。
根据本发明的一些实施例,根据所述标准化的修正文本,确定所述修正文本的文本向量,包括:
根据所述标准化的修正文本,确定短语向量;
根据所述标准化的修正文本,获得所述标准化的修正文本的每个字词的词向量;
根据所述短语向量,确定每个词向量的权值;
根据每个词向量的权值,对所述词向量进行加权求和,获得综合词向量;
对所述综合词向量和所述短语向量进行求和,获得所述文本向量。
根据本发明的一些实施例,根据所述文本向量,获取所述标准化的修正文本中的重要单词信息,包括:
通过多头注意力机制对所述文本向量进行处理,获得所述重要单词信息。
根据本发明的一些实施例,对所述重要单词信息进行分类,获得用户意图信息,包括:
对所述重要单词信息进行编码,获得重要单词向量表示;
根据所述重要单词向量表示和历史修正文本,获得历史相似度信息;
根据所述历史相似度信息和所述历史修正文本,获得记忆输出信息;
根据所述记忆输出信息和所述重要单词向量表示,获得分类状态值;
根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息。
根据本发明的一些实施例,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像,包括:
根据所述用户意图信息,对所述静态初始用户画像的浏览实体特征信息进行修正,获得修正后的浏览实体特征信息;
根据所述修正文本,对所述浏览偏好特征信息进行修正,获得修正后的浏览偏好特征信息;
根据所述第一推送消息,对所述推送频率特征信息进行修正,获得修正后的推送频率特征信息;
根据所述修正后的浏览实体特征信息、所述修正后的浏览偏好特征信息和所述修正后的推送频率特征信息,获得所述修正用户画像。
本发明还提供一种基于5G消息多轮会话机制的用户意图识别装置,所述装置包括:
初始画像模块,用于获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
推送模块,用于根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
文本内向量模块,用于根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
意图模块,用于根据所述修正文本的所述文本向量,确定用户意图信息;
修正模块,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
迭代模块,用于迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
根据本发明的一些实施例,所述初始画像模块进一步用于:
根据所述历史浏览记录的输入信息,获得浏览实体特征信息;
根据所述历史浏览记录的点击信息,和/或所述输入信息的语义信息,获得浏览偏好特征信息;
根据历史推送记录,获得推送频率特征信息;
根据所述浏览实体特征信息、所述浏览偏好特征信息和所述推送频率特征信息,获得所述静态初始用户画像。
根据本发明的一些实施例,所述文本内向量模块进一步用于:
对所述修正文本进行预处理,获得标准化的修正文本;
根据所述标准化的修正文本,确定所述修正文本的文本向量。
根据本发明的一些实施例,所述意图模块进一步用于:
根据所述文本向量,获取所述标准化的修正文本中的重要单词信息;
对所述重要单词信息进行分类,获得用户意图信息。
根据本发明的一些实施例,所述文本内向量模块进一步用于:
根据所述标准化的修正文本,确定短语向量;
根据所述标准化的修正文本,获得所述标准化的修正文本的每个字词的词向量;
根据所述短语向量,确定每个词向量的权值;
根据每个词向量的权值,对所述词向量进行加权求和,获得综合词向量;
对所述综合词向量和所述短语向量进行求和,获得所述文本向量。
根据本发明的一些实施例,所述意图模块进一步用于:
通过多头注意力机制对所述文本向量进行处理,获得所述重要单词信息。
根据本发明的一些实施例,所述意图模块进一步用于:
对所述重要单词信息进行编码,获得重要单词向量表示;
根据所述重要单词向量表示和历史修正文本,获得历史相似度信息;
根据所述历史相似度信息和所述历史修正文本,获得记忆输出信息;
根据所述记忆输出信息和所述重要单词向量表示,获得分类状态值;
根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息。
根据本发明的一些实施例,所述意图模块进一步用于:
根据所述用户意图信息,对所述静态初始用户画像的浏览实体特征信息进行修正,获得修正后的浏览实体特征信息;
根据所述修正文本,对所述浏览偏好特征信息进行修正,获得修正后的浏览偏好特征信息;
根据所述第一推送消息,对所述推送频率特征信息进行修正,获得修正后的推送频率特征信息;
根据所述修正后的浏览实体特征信息、所述修正后的浏览偏好特征信息和所述修正后的推送频率特征信息,获得所述修正用户画像。
本发明还提供一种基于多轮会话意图识别设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
根据本发明的实施例的基于5G消息多轮会话机制的用户意图识别方法及装置,可基于目标用户的修正文本来识别目标用户的意图,从而调整用户画像,并可迭代执行,从而对用户的意图理解更加充分和准确,从而获得更准确的用户画像,提升对于用户反馈的利用率,进而提升推送准确性以及内容的针对性,并提升用户获得与其意图匹配的信息的效率,提升用户体验。
附图说明
图1示例性地示出本发明实施例的基于5G消息多轮会话机制的用户意图识别方法的流程图;
图2示例性地示出本发明实施例的多头注意力机制的示意图;
图3示例性地示出本发明实施例的分类模型的示意图;
图4示例性地示出本发明实施例的基于5G消息多轮会话机制的用户意图识别装置。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3个。
应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。
取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。
由于5G消息交互形式与传统网页、APP、小程序等存在明显的差异,传统基于用户操作行为的内容推荐方法在5G消息内容精准推送场景中存在以下明显不足:
缺乏针对5G消息当前会话窗口内用户画像的动态调整方法:
传统内容推荐算法主要通过连续的用户操作行为进行用户标签调整,但是在5G消息会话场景中,用户每轮会话主题都不相同,因此不能单纯使用用户历史反馈信息进行用户标签调整。
在本实施例中,执行本方法的主体可以是CSP平台,Certified Service Partner)即认证服务合作伙伴,称作5G消息运营平台。5G消息终端与5G消息运营平台之间针对同一主题可以产生多轮会话,多轮会话过程中可以产生交互行为,基于该交互行为可以进行意图确定。
5G消息终端采集并将用户交互行为通过消息通道返回至CSP平台,CSP平台可通过5G消息终端返回的UUID及交互信息为每一位5G消息用户实现意图确定。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1示例性地示出本发明实施例的基于5G消息多轮会话机制的用户意图识别方法的流程图,如图1所示,所述方法包括:
步骤S1,获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
步骤S2,根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
步骤S3,根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
步骤S4,根据所述修正文本的所述文本向量,确定用户意图信息;
步骤S5,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
步骤S6,迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
根据本发明的实施例的基于5G消息多轮会话机制的用户意图识别方法,可基于目标用户的修正文本来识别目标用户的意图,从而调整用户画像,可对用户的意图理解更加充分和准确,从而获得更准确的用户画像,提升对于用户反馈的利用率,提升推送准确性,并提升用户体验。
在本发明的一些实施例中,在步骤S1中,交互行为指的是在5G消息体下,目标用户通过5G消息终端与CSP平台进行基于5G消息的多轮交互,即多轮会话;多轮会话可以是针对同一主题进行至少一次的信息交互。而本实施例下述的通过修正文本调整推送信息,可以是结合当前会话轮次内目标用户的反馈信息进行精准的调整。
步骤S1可首先构建目标用户的静态初始用户画像,可基于目标用户的历史交互行为记录来构建静态初始用户画像,交互行为可以包括文本输入类型交互行为、以及非文本输入类型交互行为。非文本输入类型的交互行为可以包括:在5G消息体内通过点击、输入、浏览、滑动等行为浏览和阅读5G消息。文本输入类型交互行为可以包括在文本框中输入短信文本。基于上述交互行为可以与系统,如CSP平台算法进行互动确定静态初始用户画像。
在本发明的一些实施例中,步骤S1可包括:获取5G消息终端采集的目标用户的历史交互行为,以确定所述目标用户的静态初始用户画像,包括:从所述目标用户的历史交互行为中抽取实体信息,以确定浏览实体特征V;基于所述目标用户对所述实体信息的交互动作信息,确定浏览偏好特征P,其中,所述交互动作包括文本输入类型交互动作、以及非文本输入类型交互动作以及,基于所述实体信息的推送频率,确定所述实体信息的推送频率特征F。
在本发明的一些实施例中,用户在5G消息体内可以通过点击、输入、浏览、滑动等行为浏览和阅读5G消息,这些行为均可产生历史浏览记录。5G消息为用户提供了精准的内容推送服务,用户除了在5G消息体内可以完成推送内容的点击、浏览、转发等常规操作外,还可以通过“自由文本输入”的方式,将自己的浏览意图通过短文本的方式与后台推荐算法进行互动。5G消息终端采集并将以上交互行为通过消息通道返回至后端服务器,服务器则可构建静态初始用户画像Xt0,即,初始时刻T0的用户画像。
根据本发明的一些实施例,静态初始用户画像Xt0可包括三部分,即,浏览实体特征信息、浏览偏好特征信息和推送频率特征信息。
根据本发明的一些实施例,所述浏览实体特征信息可对所述历史浏览记录的输入信息进行向量化,获得128维向量,向量化的方式可包括使用BERT(Bidirectional EncoderRepresentations from Transformers)模型、Word2vec等方式,本发明对向量化的具体方式不做限制。
例如,目标用户在历史浏览记录中常关注“蓝牙模组”的内容,则浏览实体特征信息为
目标用户在历史浏览记录中输入过对于“医疗器械”的消极的表达信息,例如,“不看医疗器械”等信息,则浏览实体特征信息为
根据本发明的一些实施例,览偏好特征信息用于刻画目标用户对每一个实体信息近10次的浏览偏好权重。如用户对“蓝牙模组”实体表现出明确的浏览兴趣,如点击、浏览、详情页上下滑动、文字输入包含“喜欢、只看、推送”等关键词,则当次浏览偏好特征记录为1。反之,如果用户对“医疗器械”实体表现出明确的不感兴趣,如删除、文字输入包含“不喜欢、不推送”等关键词,则当次浏览偏好特征记录为0。其他未明确表示情况下,当前浏览偏好特征记录为0.5。
在示例中,在T0时刻,关于蓝牙模组的浏览偏好特征信息为
关于医疗器械的浏览偏好特征信息为
根据本发明的一些实施例,可根据历史推送记录,获得推送频率特征信息。推送频率特征信息用于刻画当前实体在近100次推送行为中的推送频率,可用于调节实体推送过程中“过热”及“过冷”的情况。例如,T0时刻前100次推送中,“蓝牙模组”相关的实体被推送了67次,则推送频率特征信息
根据本发明的一些实施例,综上,在获得浏览实体特征信息、浏览偏好特征信息和推送频率特征信息后,可获得静态初始用户画像,在示例中,可通过表示T0时刻的静态初始用户画像/>其中,/>表示128维的浏览实体特征信息,/>表示10维的浏览偏好特征信息,/>表示推送频率特征信息,n表示实体的数量,例如,“蓝牙模组”、“医疗器械”等实体的数量。
根据本发明的一些实施例,在步骤S2中,可通过静态初始用户画像来筛选第一推送消息,例如,静态初始用户画像可表示为向量信息,并可将内容数据库中的消息进行向量化,从而确定静态初始用户画像和消息的向量之间的相似度,并基于相似度选择第一推送消息并进行推送。
根据本发明的一些实施例,在步骤S3中,由于推送的第一推送消息是根据目标用户的历史浏览记录选择的,因此,可能存在一定的偏差,例如,推送的内容不够精准,或者内容的细节不够丰富等。而5G消息可接收用户的输入,即,修正文本,可基于修正文本修正用户的静态初始用户画像,从而获得更准确的修正用户画像。例如,修正文本可包括对于用户想看的内容的描述,例如,“仅看XX网站的蓝牙模组的新闻”等。本发明对修正文本的具体内容不做限制。
根据本发明的一些实施例,修正文本可包括递进式修正文本,递进式修正文本可表示目标用户希望浏览更细粒度的信息,例如,第一推送消息为“蓝牙模组”的消息,用户修正文本为“蓝牙模组芯片”、“蓝牙通信芯片”、“蓝牙通信协议”等。
根据本发明的一些实施例,修正文本可包括否定式修正文本,否定式修正文本表示目标用户不想看第一推送消息的内容,例如,“不看、不推、不想”等包含否定第一推送消息的语句。例如,“不看蓝牙模组”、“不推蓝牙相关”等。
根据本发明的一些实施例,修正文本可包括筛选式修正文本,筛选式修正文本表示增加若干筛选逻辑。例如,筛选式修正文本中可包括“只看、只推、只要、除”等信息,例如,“只看最新的新闻”、“只推送XX网上的新闻”等。
根据本发明的一些实施例,在接收到目标用户输入的修正文本后,步骤S3可包括:对所述修正文本进行预处理,获得标准化的修正文本;根据所述标准化的修正文本,确定所述修正文本的文本向量。
根据本发明的一些实施例,所述预处理可包括分词和去停用词等步骤。分词处理可包括结巴分词处理。结巴分词是基于统计的分词方法的基本原理是根据字符串在语料库中出现的统计频率来决定其是否构成词。词是字的组合,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映出它们成为词的可信度。例如,当用户在5G消息中输入“只看XX网上蓝牙模组的新闻”。此时,结巴分析会将上述短文本划分为“只|看|XX网|上|蓝牙模组|的|新闻”。
根据本发明的一些实施例,预处理还可包括去停用词的步骤,在识别用户意图的过程中,不需要修正文本中的介词、冠词、助词、代词、连词等,因此可利用停用词库对分词后的文本进行去停用词处理。例如,上述短文本分词后得到“只|看|XX网|上|蓝牙模组|的|新闻”,去掉以上停用词后,可获得“只、看、XX网、上、蓝牙模组、新闻”。在进行上述预处理后,可获得标准化的修正文本。
根据本发明的一些实施例,在获得标准化的修正文本后,可获得文本向量。在示例中,可使用BERT和word2vec的联合模型来确定文本向量。根据所述标准化的修正文本,确定文本向量,包括:根据所述标准化的修正文本,确定短语向量;根据所述标准化的修正文本,获得所述标准化的修正文本的每个字词的词向量;根据所述短语向量,确定每个词向量的权值;根据每个词向量的权值,对所述词向量进行加权求和,获得综合词向量;对所述综合词向量和所述短语向量进行求和,获得所述文本向量。
根据本发明的一些实施例,可使用BERT模型将标准化的修正文本转化为短语向量。再使用Word2vec将标准化的修正文本的每个字词转换为词向量。
根据本发明的一些实施例,可根据短语向量,获得每个词向量的权值,该步骤可包括:
根据公式(1),确定每个词向量的权值,
其中,Si通过以下公式(2)表示:
A为所述短语向量,Bi为第i个字词的词向量,wi为第i个词向量的权值。
根据本发明的一些实施例,在基于公式(1)和公式(2)确定每个词向量的权值后,可对每个词向量进行加权求和,再与短语向量进行求和,获得文本向量。
根据本发明的一些实施例,在步骤S4中,可根据所述修正文本的所述文本向量,确定用户意图信息,该步骤包括根据所述文本向量,获取所述标准化的修正文本中的重要单词信息;对所述重要单词信息进行分类,获得用户意图信息。
根据本发明的一些实施例,根据所述文本向量,获取所述标准化的修正文本中的重要单词信息,包括:通过多头注意力机制对所述文本向量进行处理,获得所述重要单词信息。
图2示例性地示出本发明实施例的多头注意力机制的示意图。
根据本发明的一些实施例,由于目标用户在每轮人机对话过程中用户可能产生多个意图,因此,对话过程中的每个修正文本均对应多个意图标签,然而不同词语对不同意图标签的影响程度不同,为了突出对识别结果具有决定意义的词语,可采用多头注意力机制对修正文本中的不同词语进行权重分配,让不同词语拥有不同的权重,增强多意图识别的正确性。相比于其他注意力机制,多头注意力可以同时获取与多个意图相关的不同词语,从而多角度地获取更重要的词语信息。
根据本发明的一些实施例,如图2所示,可多次输入弹头注意力机制,每个单头相对独立,并将多次注意力结果融合得到最终结果,由此获得与不同意图标签产生关键影响的重要单词信息。注意力机制为查询信息Q到键值对K-V的映射,每个注意力的头部都使用自注意力,寻找序列内部的联系。多头注意力机制的计算方法如下:首先对Q、K、V进行线性变换,然后输入到放缩点积注意力中计算多次,每一次算一个头,头之间的参数不共享,最后将多次的放缩点积注意力结果从左到右进行拼接,再进行一次线性变换得到的注意力矩阵X作为多头注意力的结果。公式如以下(3)-(5)所示:
其中,Q、K、V分别代表Query矩阵,Key矩阵,Value矩阵且值相等,均为输入的文本向量。指的是键向量维度的平方根,起到调节作用,控制Q和K的内积不会太大;W是线性变化的参数,每次Q、K、V进行线性变换时W是不一样的;h表示头的数量,i表示第i个注意力头部。
根据本发明的一些实施例,经过多头注意力机制的处理,可保留注意力集中的单词作为重要单词信息,例如,“只、看、XX网、上、蓝牙模组、新闻”仅保留“只、XX网、蓝牙模组、新闻”。
根据本发明的一些实施例,对所述重要单词信息进行分类,获得用户意图信息,包括:对所述重要单词信息进行编码,获得重要单词向量表示;根据所述重要单词向量表示和历史修正文本,获得历史相似度信息;根据所述历史相似度信息和所述历史修正文本,获得记忆输出信息;根据所述记忆输出信息和所述重要单词向量表示,获得分类状态值;根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息。
图3示例性地示出本发明实施例的分类模型的示意图,在示例中,重要单词信息保持了目标用户输入的修正文本的语序,可使用具有记忆功能的BLSTM网络模型对重要单词信息进行特征分类。在示例中,可为重要单词信息分类为“递进式短语、否定式短语、筛选式短语、产品|技术|领域类短语、其他”5种类别。
根据本发明的一些实施例,可通过BLSTM网络模型对重要单词信息和历史对话信息(即,目标用户的历史输入文本)进行编码,例如,输入128层的神经网络,得到重要单词的向量表示c。将近100轮历史对话信息xh作为输入变量输入128层的神经网络,得到重要单词的向量表示li,i=1,..100。
根据本发明的一些实施例,通过计算当前对话c和历史对话li的内积,来表示当前对话与历史对话的相似程度,利用softmax函数将内积内积做归一化,获得历史相似度信息pi,pi作为注意力的概率分布,概率值越大,表明历史信息中的某轮对话与当前的对话内容相似度越高。具体公式如以下公式(6):
pi=softmax(cTli) (6)
根据本发明的一些实施例,pi作为权重,将历史修正文本中的每轮对话乘以其对应的权重,然后再相加得到的新向量hi即为记忆输出信息,如以下公式(7):
根据本发明的一些实施例,以上引入了历史修正文本并为其分配了权重,但是历史修正文本中有些对话与当前对话的意图相关,也有些对话与当前对话的意图无关,如果无差别的引入会出现引入很多噪声的情况,这会对目标用户的当前的修正文本的意图判别产生负面影响。因此,需要对历史信息有一定的筛选能力,过滤掉无用的历史信息。可根据以下公式(8)确定分类状态值:
g=sigmoid(Wg*[c,hi])i=1,..,100 (8)
其中,Wg是门函数g的线性变化的参数向量,hi是第i个记忆输出信息,向量g为函数产生的状态值,其取值在0到1之间,当g接近0,表示当前修正文本的意图识别不需要参考历史修正文本;当g接近1,表示当前修正文本的意图识别需要参考修正文本。
根据本发明的一些实施例,可根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息o,如以下公式(9)所示:
o=sigmoid(Wo*[c,gh]) (9)
其中,Wo为线性变换函数,o是预测的用户意图信息,其维度就是标注的意图标签维度。
根据本发明的一些实施例,基于以上分类,可确定各个重要单词的意图分类,如以下表1所示:
表1用户意图信息
序号 | 意图词性类别 | 重要单词 | o |
1 | 递进式短语 | 只 | 0.7323 |
2 | 否定式短语 | —— | |
3 | 筛选式短语 | XX网、新闻 | 0.4238 |
4 | 产品|技术|领域类短语 | 蓝牙模组 | 0.7234 |
5 | 其他 | 看 | 0.4372 |
根据本发明的一些实施例,在步骤S5中,可利用以上获得的用户意图信息,以及第一推送消息和修正文本修正静态初始用户画像,获得更准确的修正用户画像。步骤S5可包括:根据所述用户意图信息,对所述静态初始用户画像的浏览实体特征信息进行修正,获得修正后的浏览实体特征信息;根据所述修正文本,对所述浏览偏好特征信息进行修正,获得修正后的浏览偏好特征信息;根据所述第一推送消息,对所述推送频率特征信息进行修正,获得修正后的推送频率特征信息;根据所述修正后的浏览实体特征信息、所述修正后的浏览偏好特征信息和所述修正后的推送频率特征信息,获得所述修正用户画像。
在示例中,针对蓝牙模组的浏览实体特征信息,修正的公式如以下公式(10)所示:
其中,为T1时刻针对蓝牙模组的修正后的浏览实体特征信息,ε根据修正文本是否有否定式短语取值1或-1,ot1为用户意图信息,∑o为历史修正文本中的意图信息。在示例中,经过以上修正,修正后的浏览实体特征信息为:
根据本发明的一些实施例,可基于最近一次修正文本的输入,更新最近10次输入的浏览偏好特征信息,在示例中,T1时刻的蓝牙模组的浏览偏好特征信息为:
根据本发明的一些实施例,由于最近一次输入后,推送了蓝牙模组相关的信息,则T1时刻的推送频率特征信息更新为:
根据本发明的一些实施例,T1时刻的修正用户画像被更新为:
根据本发明的一些实施例,在步骤S6中,可迭代执行以上步骤,直到不再接收到修正文本,在这种情况下,推送的消息与用户的意图匹配,获得的目标用户画像可准确地描述用户的意图。
根据本发明的一些实施例,在获得上述修正用户画像后,系统可再次基于修正用户画像推送5G消息,并确定用户是否继续输入修正文本,可迭代上述处理,直到用户不在输入修正文本,则可确定推送的5G消息与用户意图匹配。
根据本发明的实施例的基于5G消息多轮会话机制的用户意图识别方法,可基于目标用户的修正文本来识别目标用户的意图,从而调整用户画像,并可迭代执行,从而对用户的意图理解更加充分和准确,从而获得更准确的用户画像,提升对于用户反馈的利用率,进而提升推送准确性以及内容的针对性,并提升用户获得与其意图匹配的信息的效率,提升用户体验。
图4示例性地示出本发明实施例的基于5G消息多轮会话机制的用户意图识别装置,如图4所示,所述装置包括:
初始画像模块11,用于获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
推送模块12,用于根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
文本内向量模块13,用于根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
意图模块14,用于根据所述修正文本的所述文本向量,确定用户意图信息;
修正模块15,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
迭代模块16,用于迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
根据本发明的一些实施例,获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像,包括:
所述目标用户的历史交互行为中抽取实体信息,以确定浏览实体特征V;
基于所述目标用户对所述实体信息的交互动作信息,确定浏览偏好特征P;
以及,基于所述实体信息的推送频率,确定所述实体信息的推送频率特征F。
根据本发明的一些实施例,根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量,包括:
对所述修正文本进行预处理,获得标准化的修正文本;
根据所述标准化的修正文本,确定所述修正文本的文本向量。
根据本发明的一些实施例,根据所述修正文本的所述文本向量,确定用户意图信息,包括:
根据所述文本向量,获取所述标准化的修正文本中的重要单词信息;
对所述重要单词信息进行分类,获得用户意图信息。
根据本发明的一些实施例,根据所述标准化的修正文本,确定所述修正文本的文本向量,包括:
根据所述标准化的修正文本,确定短语向量;
根据所述标准化的修正文本,获得所述标准化的修正文本的每个字词的词向量;
根据所述短语向量,确定每个词向量的权值;
根据每个词向量的权值,对所述词向量进行加权求和,获得综合词向量;
对所述综合词向量和所述短语向量进行求和,获得所述文本向量。
根据本发明的一些实施例,根据所述文本向量,获取所述标准化的修正文本中的重要单词信息,包括:
通过多头注意力机制对所述文本向量进行处理,获得所述重要单词信息。
根据本发明的一些实施例,对所述重要单词信息进行分类,获得用户意图信息,包括:
对所述重要单词信息进行编码,获得重要单词向量表示;
根据所述重要单词向量表示和历史修正文本,获得历史相似度信息;
根据所述历史相似度信息和所述历史修正文本,获得记忆输出信息;
根据所述记忆输出信息和所述重要单词向量表示,获得分类状态值;
根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息。
根据本发明的一些实施例,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像,包括:
根据所述用户意图信息,对所述静态初始用户画像的浏览实体特征信息进行修正,获得修正后的浏览实体特征信息;
根据所述修正文本,对所述浏览偏好特征信息进行修正,获得修正后的浏览偏好特征信息;
根据所述第一推送消息,对所述推送频率特征信息进行修正,获得修正后的推送频率特征信息。
本发明可以是方法、装置、设备和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
注意,除非另有直接说明,否则本说明书(包含任何所附权利要求、摘要和附图)中所揭示的所有特征皆可由用于达到相同、等效或类似目的的可替代特征来替换。因此,除非另有明确说明,否则所公开的每一个特征仅是一组等效或类似特征的一个示例。在使用到的情况下,进一步地、较优地、更进一步地和更优地是在前述实施例基础上进行另一实施例阐述的简单起头,该进一步地、较优地、更进一步地或更优地后带的内容与前述实施例的结合作为另一实施例的完整构成。在同一实施例后带的若干个进一步地、较优地、更进一步地或更优地设置之间可任意组合的组成又一实施例。
本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明。本发明的目的已经完整并有效地实现。本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于5G消息多轮会话机制的用户意图识别方法,其特征在于,包括:
获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
根据所述修正文本的所述文本向量,确定用户意图信息;
根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
2.根据权利要求1所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像,包括:
所述目标用户的历史交互行为中抽取实体信息,以确定浏览实体特征V;
基于所述目标用户对所述实体信息的交互动作信息,确定浏览偏好特征P;
以及,基于所述实体信息的推送频率,确定所述实体信息的推送频率特征F。
3.根据权利要求1所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量,包括:
对所述修正文本进行预处理,获得标准化的修正文本;
根据所述标准化的修正文本,确定所述修正文本的文本向量。
4.根据权利要求1所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,根据所述修正文本的所述文本向量,确定用户意图信息,包括:
根据所述文本向量,获取所述标准化的修正文本中的重要单词信息;
对所述重要单词信息进行分类,获得用户意图信息。
5.根据权利要求3所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,根据所述标准化的修正文本,确定所述修正文本的文本向量,包括:
根据所述标准化的修正文本,确定短语向量;
根据所述标准化的修正文本,获得所述标准化的修正文本的每个字词的词向量;
根据所述短语向量,确定每个词向量的权值;
根据每个词向量的权值,对所述词向量进行加权求和,获得综合词向量;
对所述综合词向量和所述短语向量进行求和,获得所述文本向量。
6.根据权利要求4所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,根据所述文本向量,获取所述标准化的修正文本中的重要单词信息,包括:
通过多头注意力机制对所述文本向量进行处理,获得所述重要单词信息。
7.根据权利要求4所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,对所述重要单词信息进行分类,获得用户意图信息,包括:
对所述重要单词信息进行编码,获得重要单词向量表示;
根据所述重要单词向量表示和历史修正文本,获得历史相似度信息;
根据所述历史相似度信息和所述历史修正文本,获得记忆输出信息;
根据所述记忆输出信息和所述重要单词向量表示,获得分类状态值;
根据所述分类状态值、所述重要单词向量表示和记忆输出信息,获得用户意图信息。
8.根据权利要求2所述的基于5G消息多轮会话机制的用户意图识别方法,其特征在于,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像,包括:
根据所述用户意图信息,对所述静态初始用户画像的浏览实体特征信息进行修正,获得修正后的浏览实体特征信息;
根据所述修正文本,对所述浏览偏好特征信息进行修正,获得修正后的浏览偏好特征信息;
根据所述第一推送消息,对所述推送频率特征信息进行修正,获得修正后的推送频率特征信息。
9.一种基于5G消息多轮会话机制的用户意图识别装置,其特征在于,包括:
初始画像模块,用于获取5G消息终端采集的历史5G消息,以基于所述历史5G消息指示的目标用户的历史交互行为确定所述目标用户的静态初始用户画像;
推送模块,用于根据所述静态初始用户画像,在内容数据库中确定第一推送消息,并推送至所述目标用户;
文本内向量模块,用于根据接收到的所述目标用户针对所述第一推送消息的修正文本,确定所述修正文本的文本向量;
意图模块,用于根据所述修正文本的所述文本向量,确定用户意图信息;
修正模块,根据所述用户意图信息、所述第一推送消息和所述修正文本,对所述静态初始用户画像进行修正,获取修正用户画像;
迭代模块,用于迭代执行所述获取修正用户画像的处理,获得目标用户画像,所述目标用户画像用于描述所述目标用户的意图。
10.一种基于多轮会话意图识别设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310250895.3A CN116521822B (zh) | 2023-03-15 | 2023-03-15 | 基于5g消息多轮会话机制的用户意图识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310250895.3A CN116521822B (zh) | 2023-03-15 | 2023-03-15 | 基于5g消息多轮会话机制的用户意图识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116521822A true CN116521822A (zh) | 2023-08-01 |
CN116521822B CN116521822B (zh) | 2024-02-13 |
Family
ID=87407159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310250895.3A Active CN116521822B (zh) | 2023-03-15 | 2023-03-15 | 基于5g消息多轮会话机制的用户意图识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116521822B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116896582A (zh) * | 2023-09-11 | 2023-10-17 | 四川中电启明星信息技术有限公司 | 一种面向多级组织的实时消息推送方法、装置及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020019686A1 (zh) * | 2018-07-27 | 2020-01-30 | 众安信息技术服务有限公司 | 一种会话交互方法及装置 |
CN111460806A (zh) * | 2020-03-09 | 2020-07-28 | 平安科技(深圳)有限公司 | 基于损失函数的意图识别方法、装置、设备及存储介质 |
CN111683143A (zh) * | 2020-06-08 | 2020-09-18 | 北京奇艺世纪科技有限公司 | 消息推送方法、装置、电子设备及计算机可读存储介质 |
WO2021068321A1 (zh) * | 2019-10-12 | 2021-04-15 | 平安科技(深圳)有限公司 | 基于人机交互的信息推送方法、装置和计算机设备 |
CN113486143A (zh) * | 2021-05-25 | 2021-10-08 | 北京工业大学 | 一种基于多层级文本表示及模型融合的用户画像生成方法 |
CN113946754A (zh) * | 2021-10-29 | 2022-01-18 | 平安科技(深圳)有限公司 | 基于用户画像的权益推荐方法、装置、设备及存储介质 |
CN114372573A (zh) * | 2022-01-07 | 2022-04-19 | 中国人民解放军国防科技大学 | 用户画像信息识别方法、装置、计算机设备和存储介质 |
WO2023029502A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于问诊会话构建用户画像的方法、装置、设备和介质 |
-
2023
- 2023-03-15 CN CN202310250895.3A patent/CN116521822B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020019686A1 (zh) * | 2018-07-27 | 2020-01-30 | 众安信息技术服务有限公司 | 一种会话交互方法及装置 |
WO2021068321A1 (zh) * | 2019-10-12 | 2021-04-15 | 平安科技(深圳)有限公司 | 基于人机交互的信息推送方法、装置和计算机设备 |
CN111460806A (zh) * | 2020-03-09 | 2020-07-28 | 平安科技(深圳)有限公司 | 基于损失函数的意图识别方法、装置、设备及存储介质 |
CN111683143A (zh) * | 2020-06-08 | 2020-09-18 | 北京奇艺世纪科技有限公司 | 消息推送方法、装置、电子设备及计算机可读存储介质 |
CN113486143A (zh) * | 2021-05-25 | 2021-10-08 | 北京工业大学 | 一种基于多层级文本表示及模型融合的用户画像生成方法 |
WO2023029502A1 (zh) * | 2021-08-30 | 2023-03-09 | 康键信息技术(深圳)有限公司 | 基于问诊会话构建用户画像的方法、装置、设备和介质 |
CN113946754A (zh) * | 2021-10-29 | 2022-01-18 | 平安科技(深圳)有限公司 | 基于用户画像的权益推荐方法、装置、设备及存储介质 |
CN114372573A (zh) * | 2022-01-07 | 2022-04-19 | 中国人民解放军国防科技大学 | 用户画像信息识别方法、装置、计算机设备和存储介质 |
Non-Patent Citations (2)
Title |
---|
刘勇;吴翔宇;解本巨;: "基于动态用户画像的信息推荐研究", 计算机系统应用, no. 06 * |
程全;: "基于用户画像的数字图书馆信息服务模式研究", 图书馆学刊, no. 04 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116896582A (zh) * | 2023-09-11 | 2023-10-17 | 四川中电启明星信息技术有限公司 | 一种面向多级组织的实时消息推送方法、装置及系统 |
CN116896582B (zh) * | 2023-09-11 | 2023-12-15 | 四川中电启明星信息技术有限公司 | 一种面向多级组织的实时消息推送方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116521822B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11347783B2 (en) | Implementing a software action based on machine interpretation of a language input | |
US20230214781A1 (en) | Generating Smart Reminders by Assistant Systems | |
CN109241251B (zh) | 一种会话交互方法 | |
US9792279B2 (en) | Methods and systems for analyzing communication situation based on emotion information | |
US10521189B1 (en) | Voice assistant with user data context | |
US10387410B2 (en) | Method and system of classification in a natural language user interface | |
US20220067115A1 (en) | Information processing method, apparatus, electrical device and readable storage medium | |
CN109145213B (zh) | 基于历史信息的查询推荐方法及装置 | |
CN107580704A (zh) | 上下文人物推荐 | |
CN111241237A (zh) | 一种基于运维业务的智能问答数据处理方法及装置 | |
CN116720004B (zh) | 推荐理由生成方法、装置、设备及存储介质 | |
CN109582869B (zh) | 一种数据处理方法、装置和用于数据处理的装置 | |
CN116521822B (zh) | 基于5g消息多轮会话机制的用户意图识别方法和装置 | |
CN115955452B (zh) | 基于多轮会话意图识别的5g消息推送方法和装置 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN114119123A (zh) | 信息推送的方法和装置 | |
US20230063713A1 (en) | Sentence level dialogue summaries using unsupervised machine learning for keyword selection and scoring | |
CN115186179A (zh) | 保险产品推送方法和装置 | |
CN113256379A (zh) | 一种为商品关联购物需求的方法 | |
CN112989046A (zh) | 实时话术预判方法、装置、计算机设备和存储介质 | |
US11363352B2 (en) | Video content relationship mapping | |
KR20210039608A (ko) | 기록매체 | |
KR20210039618A (ko) | 의사 표현 이미지 아이템을 분석 및 제공하는 메시지 처리 장치 | |
KR20200101537A (ko) | 피드백 의사 표현 아이템을 제공하는 메시지 처리 방법 | |
CN116628179B (zh) | 一种用户操作数据的可视化与人机交互推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |