CN117573844B - 一种基于上下文感知的数据推荐方法、装置及相关介质 - Google Patents
一种基于上下文感知的数据推荐方法、装置及相关介质 Download PDFInfo
- Publication number
- CN117573844B CN117573844B CN202410053339.1A CN202410053339A CN117573844B CN 117573844 B CN117573844 B CN 117573844B CN 202410053339 A CN202410053339 A CN 202410053339A CN 117573844 B CN117573844 B CN 117573844B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- session
- emotion
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000004044 response Effects 0.000 claims abstract description 31
- 238000005516 engineering process Methods 0.000 claims abstract description 9
- 238000013135 deep learning Methods 0.000 claims abstract description 8
- 230000008451 emotion Effects 0.000 claims description 94
- 238000011156 evaluation Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 14
- 230000009471 action Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于上下文感知的数据推荐方法、装置及相关介质,该方法包括:获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征;基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;利用所述数据推荐模型对用户发起的会话进行应答推送。本发明通过为用户构建用户兴趣画像,然后通过会话信息中的会话特征来对用户兴趣画像进行查询,以向用户返回更加准确可靠的应答内容,从而提高对于用户的数据推荐准确度。
Description
技术领域
本发明涉及计算机软件技术领域,特别涉及一种基于上下文感知的数据推荐方法、装置及相关介质。
背景技术
用户在通过小程序、浏览器网页或者是应用程序等方式对销售人员的数字名片进行浏览时,可以点击进入“AI会话”的对话界面。AI会话实质上属于一种语音助手,它可以进行类似人类的对话,捕获上下文并提供智能的应答。因此,当用户进入“AI会话”时,服务器可以根据用户相应的会话信息来与用户进行应答推送。但是目前的AI会话在应答推送方面仅仅从用户发送的会话信息提取字面信息,并且在回复用户时经常会采用固定内容,导致应答推送的内容不够准确,用户体验感不足。
发明内容
本发明实施例提供了一种基于上下文感知的数据推荐方法、装置、计算机设备及存储介质,旨在提高对于用户的数据推荐准确度。
第一方面,本发明实施例提供了一种基于上下文感知的数据推荐方法,包括:
获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;
响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征;
基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
利用所述数据推荐模型对用户发起的会话进行应答推送。
第二方面,本发明实施例提供了一种基于上下文感知的数据推荐装置,包括:
画像构建单元,用于获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;
会话感知单元,用于响应于用户的会话请求,获取用户的会话信息,并对所述会话信息进行上下文感知,得到对应的会话特征;
画像查询单元,用于基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
应答推送单元,用于利用所述数据推荐模型对用户发起的会话进行应答推送。
第三方面,本发明实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于上下文感知的数据推荐方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于上下文感知的数据推荐方法。
本发明实施例提供了一种基于上下文感知的数据推荐方法、装置、计算机设备及存储介质,该方法包括:获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征;基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;利用所述数据推荐模型对用户发起的会话进行应答推送。本发明实施例通过根据用户的历史数据来为用户构建用户兴趣画像,然后当用户发送会话信息时,通过会话信息中包含的会话特征来对用户兴趣画像进行查询,以向用户返回更加准确可靠的应答内容,从而提高对于用户的数据推荐准确度。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于上下文感知的数据推荐方法的流程示意图;
图2为本发明实施例提供的一种基于上下文感知的数据推荐方法的子流程示意图;
图3为本发明实施例提供的一种基于上下文感知的数据推荐方法的另一流程示意图;
图4为本发明实施例提供的一种基于上下文感知的数据推荐装置的示意性框图;
图5为本发明实施例提供的一种基于上下文感知的数据推荐装置的子示意性框图;
图6为本发明实施例提供的一种基于上下文感知的数据推荐装置的另一示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和 “包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面请参见图1,图1为本发明实施例提供的一种基于上下文感知的数据推荐方法的流程示意图,具体包括:步骤S101~S104。
S101、获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;
S102、响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征;
S103、基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
S104、利用所述数据推荐模型对用户发起的会话进行应答推送。
本实施例通过根据用户的历史数据来为用户构建用户兴趣画像,然后当用户发送会话信息时,通过对会话信息进行上下文感知,来提取得到相应的会话特征,再根据会话特征来对用户兴趣画像进行查询,得到相应的查询结果,随后将该查询推送至用户,以使用户能够接收到更加准确可靠的应答内容,从而提高对于用户的数据推荐准确度。
本实施例中,所述的用户兴趣画像也可以称之为用户角色。作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待的数据转化联结起来。作为实际用户的虚拟代表,用户画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性,能代表产品的主要受众和目标群体。本实施例通过结合用户兴趣画像和深度学习技术等大模型手段,来实现用户的AI会话,从而提高会话过程中的应答推送准确性,以及用户在会话过程中的体验感。
还需说明的是,本实施例所提供的数据推荐方法能够适用于多种不同场景中,例如在搜索引擎中,本实施例可提升搜索引擎的个性化服务水平,更准确地满足用户搜索需求。在推荐系统中,比如电商、社交媒体等平台中,本实施例可为用户提供更符合兴趣和需求的推荐内容。在信息检索系统中,本实施例可以适用于企业内部文档管理、政府信息发布等场景,来提高信息检索的准确性和效率。在社交媒体分析中,本实施例可用于挖掘用户需求、趋势预测等。在电子商务中,对于电商网站,本实施例可优化商品搜索和推荐,提升用户购物体验。
此外,虽然本实施例提到根据用户的历史数据来构建用户兴趣画像,但是可以理解的是,为了保证用户兴趣画像的实时性和准确性,还可以在与用户的会话交互过程中实时获取用户的相关数据,例如用户在会话过程中提到喜爱篮球,那么便实时获取“篮球”这一标签数据,并对用户兴趣画像进行动态调整。或者是实时获取用户当前的浏览动作,并从中提取用户当前的浏览数据,然后根据当前的浏览数据来对用户兴趣画像进行动态调整。如此便可以确保构建的用户兴趣画像具有较高的可靠性和准确性。换句话说,本实施例所述的历史数据,并不仅仅是表示距离当前时间很久远的一段时间内的数据,其还可以表示距离当前时间很近的一段时间内的数据,例如距离当前时间十分钟之内或者一分钟之内的历史数据,而通过这一段时间内的历史数据所构建的用户兴趣画像是具有一定时效性和可靠性的。
还有,在获取用户的历史数据以及向用户推送应答内容等过程时,可以采用加密算法对过程中的数据进行加密处理。例如可以采用对称式加密,即加密和解密使用同一个密钥,通常称之为“Session Key”这种加密技术在当今被广泛采用,如DES加密标准就是一种典型的“对称式”加密法,它的Session Key长度为56bits。又或者是采用非对称式加密,即加密和解密所使用的不是同一个密钥,通常有两个密钥,称为“公钥”和“私钥”,它们两个必需配对使用,否则不能打开加密文件。这里的“公钥”是指可以对外公布的,“私钥”则不能,只能由持有人一个人知道。它的优越性就在这里,因为对称式的加密方法如果是在网络上传输加密文件就很难不把密钥告诉对方,不管用什么方法都有可能被别人窃听到。而非对称式的加密方法有两个密钥,且其中的“公钥”是可以公开的,也就不怕别人知道,收件人解密时只要用自己的私钥即可以,这样就很好地避免了密钥的传输安全性问题。
在一实施例中,所述历史数据包括用户属性数据、用户偏好数据以及用户浏览及消费数据;
如图2所示,所述S101包括:步骤S201~S203。
S201、对用户属性数据提取用户身份特征,对用户偏好数据提取用户偏好特征,以及对用户浏览及消费数据提取用户浏览及消费特征;
S202、将所述用户身份特征、用户偏好特征以及用户浏览及消费特征结合为用户画像特征,并根据所述用户画像特征构建所述用户兴趣画像;
S203、基于所述用户画像特征对所述用户兴趣画像设置多个索引标签。
本实施例中,在构建用户兴趣画像时,首先从用户的不同种类数据中提取不同类型的特征,例如从用户属性数据中提取用户身份特征,从用户偏好数据中提取用户偏好特征,以及从用户浏览及消费数据中提取用户浏览及消费特征。将提取到的不同类型的特征汇总为用户画像特征,然后根据用户画像特征构建用户兴趣画像。此外,在完成构建后,以用户的用户画像特征来设置索引标签,从而方便后续数据查询,以及提高画像展示效果。在这里,本实施例所述的用户身份特征可以包括用户年龄、性别等信息,所述的用户偏好数据可以包括用户的兴趣爱好数据,该数据可以由用户上传得到,也可以通过总结用户历史浏览数据或者消费数据等得到,例如用户的历史浏览数据大多为服装服饰,那么便可以表明该用户在近段时间可能存在购买的服装服饰的倾向,由此便可以向用户推送有关服装服饰的应答消息。又例如用户上传其兴趣爱好为运动,那么便可以根据该信息积极向用户推送运动方面的应答消息,例如运动服饰、运动装备等等。所述的用户浏览及消费数据即是指用户的浏览数据和消费数据,即用户在过往时间中主要的浏览方向是哪些,消费方向又是哪些。
在一具体实施例中,在获取用户的历史数据时,可以引入增量爬取技术,监控非结构化数据源的动态变化,实现对新信息的敏感感知。此外,通过对用户在非结构化数据源上的行为进行实时跟踪,来更好地反映用户兴趣变化。通过数据库访问接口和第三方API获取结构化数据,来对用户的最新兴趣进行实时分析,提高对用户个性化需求的准确捕捉。还可以引入多模态数据的同步处理,即多模态AI技术,确保在预处理阶段不同模态的数据能够有机融合。通过用户画像信息,优化数据清洗、转换和规范化过程,以更好地服务于后续的特征提取。另外,优化数据存储策略,采用增量存储方式,只对用户兴趣发生变化的部分进行存储更新,从而降低存储和计算成本。
多模态AI的核心在于整合和处理多种类型的数据。这种技术的复杂性在于,它需要理解和分析来自不同源的信息,并将其有效结合以产生更加准确和全面的结果。例如,视觉问答系统中,多模态AI不仅处理图像数据,还需结合自然语言理解技术来回答有关图像的问题。这涉及到深度学习、图像识别、自然语言处理等多个技术领域的综合运用。例如,BERT模型通过理解和处理大量文本数据,极大地提高了机器对自然语言的理解能力。再比如多模态AI依赖卷积神经网络(CNN)和递归神经网络(RNN),处理大量的非结构化数据,并从中提取出有用的特征,从而实现同时分析一段视频的图像内容和其中的语音信息,从而提供更加全面和深入的理解。
处理多模态数据的最大挑战之一在于如何高效地整合来自不同感知模式的数据。不同模态的数据具有不同的特性和结构,如何设计一个能够理解这些差异并有效整合它们的模型,是多模态AI的关键。例如,文本数据是离散的、结构化的,而图像数据则是连续的、高维的。音频数据和视频数据又有各自的特性。这些数据的处理方法、特征提取和表示方式都不尽相同。此外,在多模态数据处理中,不同模态之间的数据需要进行准确对齐和同步。例如,在处理视频和音频数据时,确保图像中的动作与相应的声音同步是关键。同样,在文本和图像的联合处理中,文字描述必须与相应图像中的对象正确对应。这需要复杂的时间和空间对齐技术。
在一具体应用场景中,预先设置浏览兴趣值,例如服饰、生活用品、图书等等。当用户在浏览网页时,对网页上的文本进行提取,并映射到浏览兴趣值中,以确定用户当前的浏览兴趣。例如,用户喜欢体育,则会经常浏览或者搜索体育类网页,具体搜索的过程可以是通过其他网页中跳转,还可以是直接通过搜索栏进行搜索。另外,用户在浏览网页时,会在后端生成相应的日志数据,通过该日志数据可以得到用户的浏览数据,然后便能够从浏览数据中总结出用户的当前兴趣倾向,从而确定偏好数据。当然,由于网页中可能会存在广告等干扰信息,这就会使得得到的偏好数据并非完全准确。可以理解的是,当网页存在广告等干扰信息时,其中的文本内容通常比较集中;而用户浏览的网页中的网页文本通常比较分散,因此可以通过文本分布情况来进一步提高偏好数据的提取准确性。
还有,本实施例在设置索引标签时,除了采用用户画像特征,还可以引入领域知识图谱作为外部知识源,通过构建领域知识图谱的索引,来提供对领域知识的更全面、深入的检索支持。进一步的,结合用户画像信息,动态更新索引,从而确保索引的实时性。
在结合用户兴趣画像和知识图谱构建索引时,一方面可以基于社交图谱进行索引标签扩展,另一方面可以基于知识图谱进行索引标签扩展。具体来说,在基于社交图谱进行索引标签扩展时,可以利用知识图谱进行信息补全,最简单有效的方法就是基于社交图谱的标签扩展(标签传播),可以利用一些标签传播算法(例如PageRank、LPA、Louvain等算法)去解决标签稀疏的问题,这里需要注意的是,社交网络不是稀疏的,用户的标签是稀疏的(大部分用户标签缺失)。在这里,由于LPA和Louvain实际上属于社群发现算法,因此可以将用户标签按照类别划分,从而与社群相对应,这就使得划分出来的社群具有一定的相似性,同时由于社群的标签也是具有相似性的,因此可以将有标签的信息复制到没有标签信息的节点上。在基于知识图谱进行标签扩展时,与基于社交图谱做标签的扩展传播不同,而这里用到的是知识图谱,这里的“知识”实际上是一个概念网络,就是由标签构成的网络,这里可能就需要补充一些外部知识,比较简单通俗的理解就是标签联想,比如看到篮球会联想到篮球联赛,那么如果一个人说他喜欢篮球,那么是不是可以联想到他是不是也喜欢观看篮球联赛呢?如果喜欢观看篮球联赛,那么是不是就会喜欢篮球明星呢等等。这就是一个联想推理的过程,所以这里的标签扩展是一个标签概念的扩展和关联,一个篮球的标签可以扩展出篮球联赛、球星、运动等等一系列的标签,这样对于用户的画像会显得更加饱满。然后在利用实体概念网络对基于知识图谱的索引标签进行扩展。
在一实施例中,所述步骤S102包括:
获取所述会话信息,并采集所述会话信息的上下文信息;
通过深度神经网络对所述会话信息和上下文信息分别进行特征提取,得到第一特征和第二特征;
将所述第一特征和第二特征融合为所述会话特征。
本实施例中,通过对会话信息及上下文信息提取特征,来得到会话特征,从而通过该会话特征进行数据查询和推荐。本实施例所述的深度神经网络可以为卷积神经网络,也可以为循环神经网络。在提取第一特征或者第二特征时,首先将会话信息或者上下文信息输入至深度神经网络的输入层中,并通过所述输入层输入至多层隐藏层中;然后利用每一所述隐藏层中的神经元对所述会话信息或者上下文信息进行线性变换,得到隐藏层输出的中间特征;再通过深度神经网络中输出层的非线性激活函数对所述中间特征进行信息提取,输出得到对应的第一特征或者第二特征。
在一些可选实施例中,在对上下文信息进行特征提取时,具体可以从身份、偏好和消费三个方面进行,即对身份上下文信息、偏好上下文信息以及消费上下文信息分别进行特征提取,从而根据这三个方面的上下文信息来构建更加准确的会话特征,使最终的数据推荐结果也更加准确可靠。
在一实施例中,所述步骤S103包括:
获取会话特征与每一所述索引标签之间的候选相似度;
按照预设相似度阈值对所述候选相似度进行筛选,得到目标相似度;
确定所述目标相似度对应的目标索引标签,并根据所述目标索引标签查询对应的目标用户画像特征;
过滤目标用户画像特征的用户身份特征,并将目标用户画像特征的剩余内容作为所述查询结果。
本实施例中,通过计算会话特征与索引标签之间的相似度,来确认与会话特征最为相似的前N个索引标签,然后便可以依据索引标签来对用户兴趣画像进行查询,从而得到相应的目标用户画像特征。此时,可以先判断下该目标用户画像特征是否为用户身份特征,如果是的话,则将其过滤掉;如果不是用户身份特征,则可以将其作为查询结果并推送至用户。
在具体实施例中,可以使用欧几里得距离、切比雪夫距离、余弦相似度以及Jaccard相似系数等多种相似度算法来计算会话特征与索引标签之间的相似度。
此外,在对用户兴趣画像进行查询时,可以采用相应的查询算法进行查询。例如由于本实施例构建有索引标签,因此可以采用索引扫描的方式进行查询。又例如通过线性搜索、二分搜索、哈希表等搜索算法来实现查询目的。
进一步的,对于得到的查询结果,可以结合用户画像信息,引入用户兴趣画像中的权重因子,来对查询结果进行排序,以实现个性化调整。
在一实施例中,如图3所示,所述基于上下文感知的数据推荐方法还包括:步骤S301~S303。
S301、获取用户的评价反馈信息,并按照预设情感词汇对所述评价反馈信息提取对应的情感特征;
S302、采用双向门控递归单元网络对所述情感特征进行双向学习,以得到情感特征表示;
S303、根据所述情感特征表示对所述数据推荐模型进行优化更新。
本实施例引入情感分析模块,通过对用户反馈中的情感色彩进行分析,来达到更全面地了解用户的喜好和厌恶,以提高反馈模块对用户满意度的理解的目的。因此本实施例通过对用户发送的评价反馈信息提取情感特征,然后对该情感特征进行前向学习和后向学习,来得到相应的情感特征表示,接着便可以根据情感特征表示对数据推荐模型进行优化更新,
具体的,所述步骤S301包括:
选取所述评价反馈信息中的否定词和程度副词,并计算所述否定词和程度副词的得分;
选取所述评价反馈信息中的所有情感词汇,并结合所述否定词和程度副词设置所述评价反馈信息的第一目标情感强度;
计算每一情感词汇的得分,并将每一情感词汇的得分汇总为所有情感词汇的目标得分;
根据每一情感词汇的得分以及所述目标得分,设置每一情感词汇的情感强度,以及所有情感词汇的第二目标情感强度;
结合第一目标情感强度和第二目标情感强度,并将结合后的结果设置为所述情感特征。
通常来说,用户的评价反馈信息会包含一些情感词汇,例如开心之类的正面词汇,以及失望之类的负面词汇,当然也会包含一些程度词汇,例如满意、一般等程度副词,还可以包含一些否定词,例如不行、不好等等。因此本实施例通过提取这些词汇来综合设置情感特征。首先,选取评价反馈信息中的否定词和程度副词,并计算否定词和程度副词的得分:
;
式中,D为预设情感对照表,为评价反馈信息中的第i个情感词汇,w表示评价反馈信息中的第i个情感词汇/>的上下文的范围值,w大于1,/>、/>分别为对应的否定词和程度副词值,其中:
;
。
接着,选取评价反馈信息本中的情感词汇,并结合所述否定词和程度副词计算得到评价反馈信息的第一目标情感强度emoz:
;
式中,L为评价反馈信息的情感词汇总数量,L大于1。
同时计算得到第i个情感词汇的得分:
;
式中,T表示评价反馈信息,qi表示评价反馈信息中的第i种情感。
随后,采用连接的方式将所有的情感词汇得分连接得到情感词汇的目标得分emoy:
;
式中,q1表示评价反馈信息中的第1种情感、q2表示评价反馈信息中的第2种情感、qr表示评价反馈信息中的第r种情感,r表示情感种类数量,r≤L。
再计算每一情感词汇对应的情感强度:
;
式中,表示第i个情感词汇的强烈程度,如果/>在字典中,则根据预设情感对照表计算/>,否则为0;
通过连接每一情感词汇对应的情感强度,得到第二目标情感强度emod:
;
最后通过辅助特征捕捉评价反馈信息中的表情符号、标点符号、情感词和/或人称代词,并将第一目标情感强度、第二目标情感强度、情感词汇的目标得分和辅助特征连接得到所述情感特征x:
。
在一实施例中,所述基于上下文感知的数据推荐方法还包括:
利用领域漂移检测器对所述数据推荐模型进行监测,并根据监测的结果对所述数据推荐模型的模型参数进行调节。
本实施例通过引入领域漂移检测器,来监测数据源的变化,达到及时发现领域漂移现象的目的,从而保证更新模块能够快速适应新兴领域的信息变化。具体来说,可以一方面通过计算数据推荐模型的应答推送错误率的变化来检测突变型概念漂移,另一方面通过计算数据推荐模型的应答推送错误的样本与应答推送正确的样本一致性程度来检测渐进型概念漂移;其中,基于应答推送错误率的突变型概念漂移检测,是通过检测样本数据分布的改变来检测概念漂移;当概念发生变化时,数据的分布发生改变,数据推荐模型会对发生漂移的样本产生错误的应答推荐,因此,如果应答推荐错误率增加,则表明发生了概念漂移。
在实际应用场景,可以首先使用数据推荐模型对样本进行应答推送,标记应答推送错误的样本,并计算应答推送错误率,若应答推送错误率大于漂移阈值,则说明发生突变型概念漂移;若所有样本都完成分类,而应答推送错误率仍小于漂移阈值,则进一步使用一致性预测器算法检测渐进型概念漂移。即通过计算应答推送错误的样本的p值,判断应答推送错误的样本中是否存在以前未出现的新类,若存在样本的p值小于漂移阈值,则说明数据发生渐进型概念漂移,若所有应答推送错误的样本的p值都大于漂移阈值,则说明数据未发生概念漂移。 其中,p值表示在样本序列中比待测样本奇异值大的样本数量占样本总数的比例。
图4为本发明实施例提供的一种基于上下文感知的数据推荐装置400的示意性框图,该装置400包括:
画像构建单元401,用于获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;
会话感知单元402,用于响应于用户的会话请求,获取用户的会话信息,并对所述会话信息进行上下文感知,得到对应的会话特征;
画像查询单元403,用于基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
应答推送单元404,用于利用所述数据推荐模型对用户发起的会话进行应答推送。
在一实施例中,所述历史数据包括用户属性数据、用户偏好数据以及用户浏览及消费数据;
如图5所示,所述画像构建单元401包括:
第一特征提取单元501,用于对用户属性数据提取用户身份特征,对用户偏好数据提取用户偏好特征,以及对用户浏览及消费数据提取用户浏览及消费特征;
特征结合单元502,用于将所述用户身份特征、用户偏好特征以及用户浏览及消费特征结合为用户画像特征,并根据所述用户画像特征构建所述用户兴趣画像;
索引设置单元503,用于基于所述用户画像特征对所述用户兴趣画像设置多个索引标签。
在一实施例中,所述会话感知单元402包括:
信息采集单元,用于获取所述会话信息,并采集所述会话信息的上下文信息;
第二特征提取单元,用于通过深度神经网络对所述会话信息和上下文信息分别进行特征提取,得到第一特征和第二特征;
特征融合单元,用于将所述第一特征和第二特征融合为所述会话特征。
在一实施例中,所述画像查询单元403包括:
相似度获取单元,用于获取会话特征与每一所述索引标签之间的候选相似度;
相似度筛序单元,用于按照预设相似度阈值对所述候选相似度进行筛选,得到目标相似度;
特征查询单元,用于确定所述目标相似度对应的目标索引标签,并根据所述目标索引标签查询对应的目标用户画像特征;
结果设置单元,用于过滤目标用户画像特征的用户身份特征,并将目标用户画像特征的剩余内容作为所述查询结果。
在一实施例中,如图6所示,所述基于上下文感知的数据推荐装置400还包括:
第三特征提取单元601,用于获取用户的评价反馈信息,并按照预设情感词汇对所述评价反馈信息提取对应的情感特征;
特征表示单元602,用于采用双向门控递归单元网络对所述情感特征进行双向学习,以得到情感特征表示;
优化更新单元603,用于根据所述情感特征表示对所述数据推荐模型进行优化更新。
在一实施例中,所述第三特征提取单元601包括:
第一选取单元,用于选取所述评价反馈信息中的否定词和程度副词,并计算所述否定词和程度副词的得分;
第二选取单元,用于选取所述评价反馈信息中的所有情感词汇,并结合所述否定词和程度副词设置所述评价反馈信息的第一目标情感强度;
得分计算单元,用于计算每一情感词汇的得分,并将每一情感词汇的得分汇总为所有情感词汇的目标得分;
强度设置单元,用于根据每一情感词汇的得分以及所述目标得分,设置每一情感词汇的情感强度,以及所有情感词汇的第二目标情感强度;
特征设置单元,用于结合第一目标情感强度和第二目标情感强度,并将结合后的结果设置为所述情感特征。
在一实施例中,所述基于上下文感知的数据推荐装置400还包括:
漂移检测单元,用于利用领域漂移检测器对所述数据推荐模型进行监测,并根据监测的结果对所述数据推荐模型的模型参数进行调节。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本发明实施例还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种计算机设备,可以包括存储器和处理器,存储器中存有计算机程序,处理器调用存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然计算机设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (7)
1.一种基于上下文感知的数据推荐方法,其特征在于,包括:
获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;所述历史数据包括用户属性数据、用户偏好数据以及用户浏览及消费数据;
响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征;
基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
利用所述数据推荐模型对用户发起的会话进行应答推送;
所述获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像,包括:
对用户属性数据提取用户身份特征,对用户偏好数据提取用户偏好特征,以及对用户浏览及消费数据提取用户浏览及消费特征;
将所述用户身份特征、用户偏好特征以及用户浏览及消费特征结合为用户画像特征,并根据所述用户画像特征构建所述用户兴趣画像;
基于所述用户画像特征对所述用户兴趣画像设置多个索引标签;
所述基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,包括:
获取会话特征与每一所述索引标签之间的候选相似度;
按照预设相似度阈值对所述候选相似度进行筛选,得到目标相似度;
确定所述目标相似度对应的目标索引标签,并根据所述目标索引标签查询对应的目标用户画像特征;
过滤目标用户画像特征的用户身份特征,并将目标用户画像特征的剩余内容作为所述查询结果;
还包括:
获取用户的评价反馈信息,并按照预设情感词汇对所述评价反馈信息提取对应的情感特征;
采用双向门控递归单元网络对所述情感特征进行双向学习,以得到情感特征表示;
根据所述情感特征表示对所述数据推荐模型进行优化更新。
2.根据权利要求1所述的基于上下文感知的数据推荐方法,其特征在于,所述响应于用户的会话请求,获取用户的会话信息,并通过深度学习技术对所述会话信息进行上下文感知,得到对应的会话特征,包括:
获取所述会话信息,并采集所述会话信息的上下文信息;
通过深度神经网络对所述会话信息和上下文信息分别进行特征提取,得到第一特征和第二特征;
将所述第一特征和第二特征融合为所述会话特征。
3.根据权利要求1所述的基于上下文感知的数据推荐方法,其特征在于,所述获取用户的评价反馈信息,并按照预设情感词汇对所述评价反馈信息提取对应的情感特征,包括:
选取所述评价反馈信息中的否定词和程度副词,并计算所述否定词和程度副词的得分;
选取所述评价反馈信息中的所有情感词汇,并结合所述否定词和程度副词设置所述评价反馈信息的第一目标情感强度;
计算每一情感词汇的得分,并将每一情感词汇的得分汇总为所有情感词汇的目标得分;
根据每一情感词汇的得分以及所述目标得分,设置每一情感词汇的情感强度,以及所有情感词汇的第二目标情感强度;
结合第一目标情感强度和第二目标情感强度,并将结合后的结果设置为所述情感特征。
4.根据权利要求1所述的基于上下文感知的数据推荐方法,其特征在于,还包括:
利用领域漂移检测器对所述数据推荐模型进行监测,并根据监测的结果对所述数据推荐模型的模型参数进行调节。
5.一种基于上下文感知的数据推荐装置,其特征在于,包括:
画像构建单元,用于获取用户的历史数据,并根据用户的历史数据为用户构建用户兴趣画像;所述历史数据包括用户属性数据、用户偏好数据以及用户浏览及消费数据;
会话感知单元,用于响应于用户的会话请求,获取用户的会话信息,并对所述会话信息进行上下文感知,得到对应的会话特征;
画像查询单元,用于基于所述会话特征,对所述用户兴趣画像进行查询,得到至少一个查询结果,并将所述查询结果推送至用户,以此建立数据推荐模型;
应答推送单元,用于利用所述数据推荐模型对用户发起的会话进行应答推送;
所述画像构建单元包括:
第一特征提取单元,用于对用户属性数据提取用户身份特征,对用户偏好数据提取用户偏好特征,以及对用户浏览及消费数据提取用户浏览及消费特征;
特征结合单元,用于将所述用户身份特征、用户偏好特征以及用户浏览及消费特征结合为用户画像特征,并根据所述用户画像特征构建所述用户兴趣画像;
索引设置单元,用于基于所述用户画像特征对所述用户兴趣画像设置多个索引标签;
所述画像查询单元包括:
相似度获取单元,用于获取会话特征与每一所述索引标签之间的候选相似度;
相似度筛序单元,用于按照预设相似度阈值对所述候选相似度进行筛选,得到目标相似度;
特征查询单元,用于确定所述目标相似度对应的目标索引标签,并根据所述目标索引标签查询对应的目标用户画像特征;
结果设置单元,用于过滤目标用户画像特征的用户身份特征,并将目标用户画像特征的剩余内容作为所述查询结果;
所述基于上下文感知的数据推荐装置还包括:
第三特征提取单元,用于获取用户的评价反馈信息,并按照预设情感词汇对所述评价反馈信息提取对应的情感特征;
特征表示单元,用于采用双向门控递归单元网络对所述情感特征进行双向学习,以得到情感特征表示;
优化更新单元,用于根据所述情感特征表示对所述数据推荐模型进行优化更新。
6.一种计算机设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的基于上下文感知的数据推荐方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的基于上下文感知的数据推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410053339.1A CN117573844B (zh) | 2024-01-15 | 2024-01-15 | 一种基于上下文感知的数据推荐方法、装置及相关介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410053339.1A CN117573844B (zh) | 2024-01-15 | 2024-01-15 | 一种基于上下文感知的数据推荐方法、装置及相关介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117573844A CN117573844A (zh) | 2024-02-20 |
CN117573844B true CN117573844B (zh) | 2024-04-05 |
Family
ID=89888511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410053339.1A Active CN117573844B (zh) | 2024-01-15 | 2024-01-15 | 一种基于上下文感知的数据推荐方法、装置及相关介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117573844B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944911A (zh) * | 2017-11-18 | 2018-04-20 | 电子科技大学 | 一种基于文本分析的推荐系统的推荐方法 |
CN110022258A (zh) * | 2018-01-10 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种即时通信的会话控制方法及装置、电子设备 |
CN112256879A (zh) * | 2020-10-29 | 2021-01-22 | 贝壳技术有限公司 | 信息处理方法和装置、电子设备和计算机可读存储介质 |
CN114254091A (zh) * | 2021-12-16 | 2022-03-29 | 浙江康旭科技有限公司 | 一种基于金融情感词典的情感倾向性分析与评价模型 |
CN117033608A (zh) * | 2023-09-28 | 2023-11-10 | 中国电子科技集团公司第十研究所 | 一种基于大语言模型的知识图谱生成式问答方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11580350B2 (en) * | 2016-12-21 | 2023-02-14 | Microsoft Technology Licensing, Llc | Systems and methods for an emotionally intelligent chat bot |
JP7207543B2 (ja) * | 2019-07-05 | 2023-01-18 | 日本電信電話株式会社 | 情報推薦装置、情報推薦システム、情報推薦方法及び情報推薦プログラム |
US20230245651A1 (en) * | 2020-03-14 | 2023-08-03 | Polypie Inc. | Enabling user-centered and contextually relevant interaction |
-
2024
- 2024-01-15 CN CN202410053339.1A patent/CN117573844B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944911A (zh) * | 2017-11-18 | 2018-04-20 | 电子科技大学 | 一种基于文本分析的推荐系统的推荐方法 |
CN110022258A (zh) * | 2018-01-10 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 一种即时通信的会话控制方法及装置、电子设备 |
CN112256879A (zh) * | 2020-10-29 | 2021-01-22 | 贝壳技术有限公司 | 信息处理方法和装置、电子设备和计算机可读存储介质 |
CN114254091A (zh) * | 2021-12-16 | 2022-03-29 | 浙江康旭科技有限公司 | 一种基于金融情感词典的情感倾向性分析与评价模型 |
CN117033608A (zh) * | 2023-09-28 | 2023-11-10 | 中国电子科技集团公司第十研究所 | 一种基于大语言模型的知识图谱生成式问答方法及系统 |
Non-Patent Citations (1)
Title |
---|
引入注意力机制的BiGRU-CNN情感分类模型;胡玉琦;李婧;常艳鹏;梁顺攀;原福永;;小型微型计算机系统;20200815(08);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117573844A (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110046304B (zh) | 一种用户推荐方法和装置 | |
US10713317B2 (en) | Conversational agent for search | |
CN112214685B (zh) | 一种基于知识图谱的个性化推荐方法 | |
US10783361B2 (en) | Predictive analysis of target behaviors utilizing RNN-based user embeddings | |
KR20160057475A (ko) | 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법 | |
CN105426550B (zh) | 一种基于用户质量模型的协同过滤标签推荐方法及系统 | |
CN113590970B (zh) | 一种基于读者偏好的个性化数字图书推荐系统、方法、计算机及存储介质 | |
CN110069713B (zh) | 一种基于用户上下文感知的个性化推荐方法 | |
TW201814556A (zh) | 資訊匹配方法及相關裝置 | |
JP2022035314A (ja) | 情報処理装置及びプログラム | |
Khan et al. | Comparative analysis on Facebook post interaction using DNN, ELM and LSTM | |
Elahi et al. | Recommender systems: Challenges and opportunities in the age of big data and artificial intelligence | |
CN115982473A (zh) | 一种基于aigc的舆情分析编排系统 | |
Sinnott et al. | Linking user accounts across social media platforms | |
CN110851694A (zh) | 基于用户记忆网络和树形结构的深度模型的个性化推荐系统 | |
CN117033804A (zh) | 一种主客观视角引导下的点击诱导检测方法 | |
CN117573844B (zh) | 一种基于上下文感知的数据推荐方法、装置及相关介质 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN116431912A (zh) | 用户画像推送方法及装置 | |
Martina et al. | A Virtual Assistant for the Movie Domain Exploiting Natural Language Preference Elicitation Strategies | |
Dziczkowski et al. | An opinion mining approach for web user identification and clients' behaviour analysis | |
CN114385915A (zh) | 一种内容推荐方法、装置、存储介质及电子设备 | |
CN114372202A (zh) | 一种内容推荐方法、装置、存储介质及电子设备 | |
CN116089712B (zh) | 基于数据挖掘与分析的热门会议推荐方法及系统 | |
CN115497482B (zh) | 一种语音对话方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |