CN114117239A - 一种房源推送方法、装置和设备 - Google Patents
一种房源推送方法、装置和设备 Download PDFInfo
- Publication number
- CN114117239A CN114117239A CN202111500616.1A CN202111500616A CN114117239A CN 114117239 A CN114117239 A CN 114117239A CN 202111500616 A CN202111500616 A CN 202111500616A CN 114117239 A CN114117239 A CN 114117239A
- Authority
- CN
- China
- Prior art keywords
- data
- preference information
- behavior data
- weight
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种房源推送方法、装置和设备,该方法包括:获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据;从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息;基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数;基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。本发明提供的技术方案,提高了房源推送的准确度。
Description
技术领域
本发明涉及软件消息推送领域,具体涉及一种房源推送方法、装置和设备。
背景技术
随着用户租房买房的需求越来越高,为满足不同用户的个性化需求,找房软件通常会根据用户在软件内的点击、搜索、聊天的操作,分析用户的找房偏好,继而为用户推荐合适的房源。但是现有的操作分析方法分析结果不够准确,从而推送房源的切合度不高,如何提高房源推送的准确度是亟待解决的问题。
发明内容
有鉴于此,本发明实施方式提供了一种房源推送方法、装置和设备,从而提高了房源推送的准确度。
根据第一方面,本发明提供了一种房源推送方法,所述方法包括:获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,所述时效数据用于统计所述点击行为数据、所述搜索行为数据和所述聊天数据距离当前时刻的时间长度;从所述点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息;基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,所述操作权重为所述点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,所述时效权重基于所述时效数据生成,用于表征所述操作权重随时间增加的变化量;基于所述权重分数从所述全部偏好信息中提取目标偏好信息,并根据所述目标偏好信息为用户推送目标房源。
可选地,所述获取用户的点击行为数据、搜索行为数据、聊天数据和时效数据,包括:获取用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,并基于所述历史记录中房源标注的预设意图标签生成所述点击行为数据;将所述用户在找房软件中的搜索词转化为预设意图标签,并基于转换得到的预设意图标签生成所述搜索行为数据;提取找房软件中所述用户的聊天记录内的意图关键词和意图关键词的情感导向,并将所述意图关键词转换为带有情感导向的预设意图标签,然后基于转化后的预设意图标签生成所述聊天数据,所述情感导向用于判定所述意图关键词是否是用户的真实偏好;获取所述点击行为数据、所述搜索行为数据和所述聊天数据各自行为发生的时刻到当前时刻的时间长度,并基于所述时间长度生成所述时效数据。
可选地,所述基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,包括:获取当前偏好信息对应的当前预设意图标签;获取所述当前预设意图标签在所述点击行为数据中的第一操作权重和第一时效权重;获取所述当前预设意图标签在所述搜索行为数据中的第二操作权重和第二时效权重;获取所述当前预设意图标签在所述聊天数据中的第三操作权重、第三时效权重和情感导向;根据如下公式计算当前偏好信息的权重分数:
S=Wday1×Waction1+Wday2×Waction2+Wday3×Waction3×f
式中,Wday1是第一时效权重,Wday2是第二时效权重,Wday3是第三时效权重,Waction1是第一操作权重,Waction2是第二操作权重,Waction3是第三操作权重,f是情感导向,S是权重分数;遍历各个偏好信息,直至所有偏好信息的权重分数计算完成为止。
可选地,所述时效权重的计算公式为:
式中,Wday是时效权重,D是距今天数。
可选地,所述基于所述权重分数从所述全部偏好信息中提取目标偏好信息,包括:基于各个偏好信息归属的房屋属性对所述偏好信息进行分类,得到多个偏好类型;遍历各个偏好类型,对属于同一偏好类型的各个偏好信息的权重分数进行比对,将权重分数最高的偏好信息作为当前偏好类型的目标偏好信息。
可选地,所述方法还包括:以预设时间间隔获取所述用户的所述目标偏好信息,并将每次获取的所述目标偏好信息存入缓存数据库;从所述缓存数据库中提取所述用户在当前时刻之前的预设时间段内的目标偏好信息,所述预设时间段的长度大于所述预设时间间隔;对所述预设时间段内的目标偏好信息进行加权计算生成所述用户的第二偏好信息;根据所述第二偏好信息为所述用户推送房源。
可选地,所述根据所述目标偏好信息为用户推送目标房源,包括:将所述目标偏好信息与房源数据库中的各个房源信息进行匹配;若当前房源信息的属性标签与所述目标偏好信息中的偏好属性重合度在预设比例之上,则将所述当前房源信息推荐给所述用户。
根据第二方面,本发明提供了一种房源推送装置,所述装置包括:数据采集模块,用于获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,所述时效数据用于统计所述点击行为数据、所述搜索行为数据和所述聊天数据距离当前时刻的时间长度;偏好提取模块,用于从所述点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息;偏好分析模块,用于基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,所述操作权重为所述点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,所述时效权重基于所述时效数据生成,用于表征所述操作权重随时间增加的变化量;房源推送模块,用于基于所述权重分数从所述全部偏好信息中提取目标偏好信息,并根据所述目标偏好信息为用户推送目标房源。
根据第三方面,本发明实施例提供了一种房源推送设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机从而执行第一方面,或者第一方面任意一种可选实施方式中所述的方法。
本申请提供的技术方案,具有如下优点:
本申请提供的技术方案,首先获取找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,之后从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息,其中点击行为数据、搜索行为数据和聊天数据各自对应了不同的预设操作权重,用来衡量不同的数据类型表示用户真实偏好的可信度,操作权重还会根据数据存在的时间产生变化,越老的数据偏好可信度越低,从而基于时效数据计算出时效权重,用来衡量操作权重根据数据存在的时间产生的变化,然后基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,最后基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。从而实现了为用户推荐房源的准确性。
此外,用户的点击行为包括用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,综合多种用户操作,进一步提高确定用户目标偏好信息的准确度。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明一个实施方式中一种房源推送方法的步骤示意图;
图2示出了本发明一个实施方式中一种房源推送装置的结构示意图;
图3示出了本发明一个实施方式中一种房源推送设备的结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
请参阅图1,在一个实施方式中,一种房源推送方法,具体包括以下步骤:
步骤S101:获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,时效数据用于统计点击行为数据、搜索行为数据和聊天数据距离当前时刻的时间长度。具体地,在本实施例中,除了获取用户在找房软件中的点击行为数据、搜索行为数据和聊天数据之外,还获取一种数据叫做时效数据,时效数据即记录了上述三种行为数据的产生时刻距离当前时刻的时间长度,由于数据时间越长其参考性越低,表示用户偏好的可信度越低。因此通过时效数据与上述三种行为数据综合分析用户的真实偏好,能够进一步提高识别用户偏好的准确度。在本实施例中,用户的点击行为数据取自神策行为日志,用户的搜索行为数据是先从用户输入的搜索关键词中识别出用户的意图词,再匹配出预设的意图标签,对于搜索关键词的识别可采用深度学习的文本识别模型,具体识别过程为现有技术,本发明不再赘述。针对用户的聊天数据,本实施例首先采用文本分类模型TextCNN识别聊天场景是否是找房场景,例如:已入住用户咨询居住期间生活问题的聊天语料,属于非找房场景,软件管家询问用户找房需求,用户详细描述自己对位置,房子面积等要求,属于找房场景。之后,针对找房场景使用预训练模型Bert判断当前预料中是否有特定偏好标签,即预设意图标签(由于用户搜索的词汇和聊天词汇多种多样,对于识别出的用户意图文本需要进行统一化,形成预设意图标签,从而便于后续数据的统一分析和处理,例如用户A搜索“南”,用户A聊天“南方”,匹配出软件中标准的预设意图标签是“朝南”。)此外,本实施例中,为了提高用户意图识别准确率,还采用词表法匹配出聊天文本中的标签词,还在管家与用户的问答对话中,综合上句问句判断当前句中的正确意图。上述提取聊天数据的具体过程为现有技术,在此不再赘述。
步骤S102:从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息。具体地,从三类行为数据中提取用户的全部偏好信息,例如:用户点击过的房源有学区房、朝北、三室等,对应提取出偏好信息“学区房”、“朝北”和“三室”,同理从用户的搜索行为数据和聊天数据中,将全部出现过的偏好信息均提取出来,以备后续分析使用。
步骤S103:基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,操作权重为点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,时效权重基于时效数据生成,用于表征操作权重随时间增加的变化量。具体地,为了进一步提高基于三种数据分析出用户真实偏好的准确性。首先对点击行为数据、搜索行为数据和聊天数据预设操作权重,在本实施例中,结合实际考虑到用户的兴趣偏好通常是搜索>聊天>点击,因此预设的操作权重比也符合该顺序,例如点击行为数据、搜索行为数据和聊天数据的操作权重比例为“2:6:5”,此外获取到的数据由于时间越长可信度越低,因此本实施例中采用随时间递减的关系建立衰减函数,时效权重的具体数值通过时间长度代入衰减函数获得。之后,考虑到四类数据之间存在耦合关系,因此本实施例采用乘法计算各个偏好信息最终的权重分数。例如:某一个偏好信息“朝南”在点击行为数据、搜索行为数据和聊天数据中均出现,获取“朝南”分别在三类数据中出现的时间,从而计算出三类数据中“朝南”的时效权重分别是f1、f2和f3,“朝南”的权重分数为2*f1+5*f2+6*f3。
步骤S104:基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。具体地,某个用户在实际情况中,产生的偏好信息是非常多的,比如“朝南、朝北、朝东、学区、别墅、楼房、1层、2层、3层、三室、二室”等等,但是上述偏好信息不一定均是用户的真是偏好信息,因此通过步骤S101~S103得到的各个偏好信息的权重分数,可以得知其中得分高的偏好信息是哪些,从而在其全部偏好信息中将得分高的目标偏好信息筛选出来,实现准确判断用户的目标偏好信息的功能,进而根据目标偏好信息为用户推荐房源,大大提高了房源推荐的准确度。
具体地,在一实施例中,上述步骤S101,具体包括如下步骤:
步骤一:获取用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,并基于历史记录中房源标注的预设意图标签生成点击行为数据。具体地,在本实施例中,获取用户在找房软件中点击行为操作数据,点击行为类型包括浏览、分享、收藏、约看和签约预览,使得用户点击行为数据的来源类型更多,提高后续分析的准确度。此外,本实施例将点击行为数据的操作权重细分到各个点击操作类型中,使得权重分数的计算更准确,例如:本实施预设浏览、分享、收藏、约看和签约预览的操作权重比例分别为1:1.3:1.8:2.4:4,对应的,若偏好信息“朝南”分别进行了浏览和分享,那么计算权重分数时,“朝南”需要分别用权重1和1.3计算两次。点击行为数据直接采用软件中房源信息标注的标准化的预设意图标签,因此无需转化。
步骤二:将用户在找房软件中的搜索词转化为预设意图标签,并基于转换得到的预设意图标签生成搜索行为数据。
步骤三:提取找房软件中用户的聊天记录内的意图关键词和意图关键词的情感导向,并将意图关键词转换为带有情感导向的预设意图标签,然后基于转化后的预设意图标签生成聊天数据,情感导向用于判定意图关键词是否是用户的真实偏好。
具体地,搜索行为数据和聊天数据的具体获取方式参考步骤S101,在此不再赘述。需要注意的是,本实施例中聊天数据的意图标签是带有情感导向的,从而提高判断用户真实偏好的准确性。例如:在本实施例中,正向情感设为+1,负向情感设备-1,假设用户的对话语料为“我想找面向南边的房子,特别不要面向东边的”,识别出语料中的两个预设意图标签分别是“朝南”和“朝东”,两个预设意图标签分别添加+1和-1的情感导向,在后续权重分数的计算过程,涉及到“朝东”的权重分数计算,聊天数据的部分的计算操作是相减,从而进一步提高了权重分数的计算准确度。
获取点击行为数据、搜索行为数据和聊天数据各自行为发生的时刻到当前时刻的时间长度,并基于时间长度生成时效数据。
具体地,在一实施例中,上述步骤S103,具体包括如下步骤:
步骤四:获取当前偏好信息对应的当前预设意图标签。
步骤五:获取当前预设意图标签在点击行为数据中的第一操作权重和第一时效权重。
步骤六:获取当前预设意图标签在搜索行为数据中的第二操作权重和第二时效权重。
步骤七:获取当前预设意图标签在聊天数据中的第三操作权重、第三时效权重和情感导向。
步骤八:根据如下公式计算当前偏好信息的权重分数:
S=Wday1×Waction1+Wday2×Waction2+Wday3×Waction3×f
式中,Wday1是第一时效权重,Wday2是第二时效权重,Wday3是第三时效权重,Waction1是第一操作权重,Waction2是第二操作权重,Waction3是第三操作权重,f是情感导向,S是权重分数;
步骤九:遍历各个偏好信息,直至所有偏好信息的权重分数计算完成为止。
具体地,以步骤一至步骤三中的例子继续说明,例如:首先在用户的各个偏好信息中提取当前偏好信息对应的当前预设意图标签,本实施例中提取的是“朝南”,经过判断“朝南”在三类数据中均有出现,三类数据的操作权重比分别为2:6:5,时间权重计算得到为0.5、0.8、0.7,在聊天数据中,情感导向是+1,那么计算出“朝南”的权重分数为2*0.5+6*0.8+5*0.7*1=9.3。同理,遍历用户的各个偏好信息,直至所有偏好信息的权重分数计算完成为止。通过上述步骤,准确的将各个类型数据中出现的用户偏好信息整合到一起分析,大大提高了识别用户真实偏好的准确率。具体地,在本实施例中,时效权重的计算公式为
式中,Wday是时效权重,D是距今天数。以天为单位计算时效权重,数据采集的日期距离前天日期的天数越长,其权重值越小,数据的可信度越低。
具体地,在一实施例中,上述步骤S104,具体包括如下步骤:
步骤十:基于各个偏好信息归属的房屋属性对偏好信息进行分类,得到多个偏好类型。
步骤十一:遍历各个偏好类型,对属于同一偏好类型的各个偏好信息的权重分数进行比对,将权重分数最高的偏好信息作为当前偏好类型的目标偏好信息。
具体地,判断用户的真实偏好,从用户的全部偏好信息中提取出权重分数高的目标偏好信息,但是各种偏好信息所对应的房屋属性不同,直接基于分数高低进行筛选难免不准确。因此,在本实施例中,首先基于各个偏好信息归属的房屋属性对偏好信息进行分类,得到多个偏好类型。例如:“朝南”、“朝东”、“朝北”均属于房屋朝向属性,“三室”、“二室”、“一室”属于房屋房间数属性,将属于同一属性的偏好信息划分在一起,得到多个偏好类型。之后针对各个偏好类型,在偏好类型内部进行权重分数的比对,例如:用户的三类行为数据中“朝南”、“朝东”、“朝北”均有出现,但是权重分数的结果分别是9.3、8.2、7.1,则选择最高分数的偏好信息作为该类型中的目标偏好信息,即“朝南”。之后,遍历各个偏好类型,从而得到一个用户的全部目标偏好信息,从而准确确定用户想找房源的朝向、面积、房间数、位置等等,大大提高了根据目标偏好信息为用户推荐房源的准确度。
具体地,在一实施例中,本发明实施例提供的一种房源推送方法,还包括如下步骤:
步骤十二:以预设时间间隔获取用户的目标偏好信息,并将每次获取的目标偏好信息存入缓存数据库。
步骤十三:从缓存数据库中提取用户在当前时刻之前的预设时间段内的目标偏好信息,预设时间段的长度大于预设时间间隔;
对预设时间段内的目标偏好信息进行加权计算生成用户的第二偏好信息。
步骤十四:根据第二偏好信息为用户推送房源。
具体地,在本实施例中,周期性的对用户的目标偏好信息进行提取,并将用户的目标偏好信息存入缓存数据库(本发明实施例采用Redis数据库进行目标偏好信息缓存)中,在需要为用户推荐房源时,从缓存数据库中获取一段时间的目标缓存信息,获取的时间段长度大于提取周期,从而保证至少从缓存数据库中取出两次存入的目标偏好信息,之后对获取的多次目标偏好信息进行加权计算(本发明实施例采用平均加权,本发明并不以此为限),从而进一步得到表征用户真实偏好准确度更高的第二偏好信息。进一步提高了后续为用户推荐合适房源的准确率。
具体地,在一实施例中,上述步骤S104,具体包括如下步骤:
步骤十五:将目标偏好信息与房源数据库中的各个房源信息进行匹配。
步骤十六:若当前房源信息的属性标签与目标偏好信息中的偏好属性重合度在预设比例之上,则将当前房源信息推荐给用户。
具体地,在获取到用户的目标偏好信息后,将用户的目标偏好信息与房源数据库中的各个房源信息进行匹配,例如某个房源信息具有10个属性标签,其中有9个都能从目标偏好信息中找到对应的信息,其匹配重合度达到90%,在本实施例中,匹配度在70%以上的房源信息即认为该房源信息匹配,从而将上述房源信息推送给用户,在遍历过全部房源信息后,将符合预设比例条件的房源信息全部推荐给用户,本发明提供的房源推荐方法应用至管家推房、推荐系统、搜索系统、用户画像等场景中,使得用户能够准确挑选其心仪的房屋。
通过上述步骤,本申请提供的技术方案,首先获取找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,之后从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息,其中点击行为数据、搜索行为数据和聊天数据各自对应了不同的预设操作权重,用来衡量不同的数据类型表示用户真实偏好的可信度,操作权重还会根据数据存在的时间产生变化,越老的数据偏好可信度越低,从而基于时效数据计算出时效权重,用来衡量操作权重根据数据存在的时间产生的变化,然后基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,最后基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。从而实现了为用户推荐房源的准确性。
此外,用户的点击行为包括用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,综合多种用户操作,进一步提高确定用户目标偏好信息的准确度。
如图2所示,本实施例还提供了一种房源推送装置,该装置包括:
数据采集模块101,用于获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,时效数据用于统计点击行为数据、搜索行为数据和聊天数据距离当前时刻的时间长度。详细内容参见上述方法实施例中步骤S101的相关描述,在此不再进行赘述。
偏好提取模块102,用于从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息。详细内容参见上述方法实施例中步骤S102的相关描述,在此不再进行赘述。
偏好分析模块103,用于基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,操作权重为点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,时效权重基于时效数据生成,用于表征操作权重随时间增加的变化量。详细内容参见上述方法实施例中步骤S103的相关描述,在此不再进行赘述。
房源推送模块104,用于基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。详细内容参见上述方法实施例中步骤S104的相关描述,在此不再进行赘述。
本发明实施例提供的房源推送装置,用于执行上述实施例提供的房源推送方法,其实现方式与原理相同,详细内容参见上述方法实施例的相关描述,不再赘述。
通过上述各个组成部分的协同合作,首先获取找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,之后从点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息,其中点击行为数据、搜索行为数据和聊天数据各自对应了不同的预设操作权重,用来衡量不同的数据类型表示用户真实偏好的可信度,操作权重还会根据数据存在的时间产生变化,越老的数据偏好可信度越低,从而基于时效数据计算出时效权重,用来衡量操作权重根据数据存在的时间产生的变化,然后基于点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,最后基于权重分数从全部偏好信息中提取目标偏好信息,并根据目标偏好信息为用户推送目标房源。从而实现了为用户推荐房源的准确性。
此外,用户的点击行为包括用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,综合多种用户操作,进一步提高确定用户目标偏好信息的准确度。
图3示出了本发明实施例的一种房源推送设备,该设备包括处理器901和存储器902,可以通过总线或者其他方式连接,图3中以通过总线连接为例。
处理器901可以为中央处理器(Central Processing Unit,CPU)。处理器901还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器902作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如上述方法实施例中的方法所对应的程序指令/模块。处理器901通过运行存储在存储器902中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器901所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至处理器901。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器902中,当被处理器901执行时,执行上述方法实施例中的方法。
上述房源推送设备具体细节可以对应参阅上述方法实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,实现的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种房源推送方法,其特征在于,所述方法包括:
获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,所述时效数据用于统计所述点击行为数据、所述搜索行为数据和所述聊天数据距离当前时刻的时间长度;
从所述点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息;
基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,所述操作权重为所述点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,所述时效权重基于所述时效数据生成,用于表征所述操作权重随时间增加的变化量;
基于所述权重分数从所述全部偏好信息中提取目标偏好信息,并根据所述目标偏好信息为用户推送目标房源。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的点击行为数据、搜索行为数据、聊天数据和时效数据,包括:
获取用户在找房软件中的浏览、分享、收藏、约看和签约预览房源的历史记录,并基于所述历史记录中房源标注的预设意图标签生成所述点击行为数据;
将所述用户在找房软件中的搜索词转化为预设意图标签,并基于转换得到的预设意图标签生成所述搜索行为数据;
提取找房软件中所述用户的聊天记录内的意图关键词和意图关键词的情感导向,并将所述意图关键词转换为带有情感导向的预设意图标签,然后基于转化后的预设意图标签生成所述聊天数据,所述情感导向用于判定所述意图关键词是否是用户的真实偏好;
获取所述点击行为数据、所述搜索行为数据和所述聊天数据各自行为发生的时刻到当前时刻的时间长度,并基于所述时间长度生成所述时效数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,包括:
获取当前偏好信息对应的当前预设意图标签;
获取所述当前预设意图标签在所述点击行为数据中的第一操作权重和第一时效权重;
获取所述当前预设意图标签在所述搜索行为数据中的第二操作权重和第二时效权重;
获取所述当前预设意图标签在所述聊天数据中的第三操作权重、第三时效权重和情感导向;
根据如下公式计算当前偏好信息的权重分数:
S=Wday1×Waction1+Wday2×Waction2+Wday3×Waction3×f
式中,Wday1是第一时效权重,Wday2是第二时效权重,Wday3是第三时效权重,Waction1是第一操作权重,Waction2是第二操作权重,Waction3是第三操作权重,f是情感导向,S是权重分数;
遍历各个偏好信息,直至所有偏好信息的权重分数计算完成为止。
5.根据权利要求1所述的方法,其特征在于,所述基于所述权重分数从所述全部偏好信息中提取目标偏好信息,包括:
基于各个偏好信息归属的房屋属性对所述偏好信息进行分类,得到多个偏好类型;
遍历各个偏好类型,对属于同一偏好类型的各个偏好信息的权重分数进行比对,将权重分数最高的偏好信息作为当前偏好类型的目标偏好信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
以预设时间间隔获取所述用户的所述目标偏好信息,并将每次获取的所述目标偏好信息存入缓存数据库;
从所述缓存数据库中提取所述用户在当前时刻之前的预设时间段内的目标偏好信息,所述预设时间段的长度大于所述预设时间间隔;
对所述预设时间段内的目标偏好信息进行加权计算生成所述用户的第二偏好信息;
根据所述第二偏好信息为所述用户推送房源。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标偏好信息为用户推送目标房源,包括:
将所述目标偏好信息与房源数据库中的各个房源信息进行匹配;
若当前房源信息的属性标签与所述目标偏好信息中的偏好属性重合度在预设比例之上,则将所述当前房源信息推荐给所述用户。
8.一种房源推送装置,其特征在于,所述装置包括:
数据采集模块,用于获取用户在找房软件中的点击行为数据、搜索行为数据、聊天数据和时效数据,所述时效数据用于统计所述点击行为数据、所述搜索行为数据和所述聊天数据距离当前时刻的时间长度;
偏好提取模块,用于从所述点击行为数据、搜索行为数据和聊天数据中提取用户的全部偏好信息;
偏好分析模块,用于基于所述点击行为数据、搜索行为数据和聊天数据各自的操作权重和时效权重计算各个偏好信息的权重分数,所述操作权重为所述点击行为数据、搜索行为数据和聊天数据各自表征用户偏好的可信度,所述时效权重基于所述时效数据生成,用于表征所述操作权重随时间增加的变化量;
房源推送模块,用于基于所述权重分数从所述全部偏好信息中提取目标偏好信息,并根据所述目标偏好信息为用户推送目标房源。
9.一种房源推送设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机从而执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111500616.1A CN114117239A (zh) | 2021-12-09 | 2021-12-09 | 一种房源推送方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111500616.1A CN114117239A (zh) | 2021-12-09 | 2021-12-09 | 一种房源推送方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114117239A true CN114117239A (zh) | 2022-03-01 |
Family
ID=80363892
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111500616.1A Pending CN114117239A (zh) | 2021-12-09 | 2021-12-09 | 一种房源推送方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114117239A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116418777A (zh) * | 2023-04-10 | 2023-07-11 | 深圳市逗娱科技有限公司 | 基于数据分析的在线聊天房间智能推送系统 |
-
2021
- 2021-12-09 CN CN202111500616.1A patent/CN114117239A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116418777A (zh) * | 2023-04-10 | 2023-07-11 | 深圳市逗娱科技有限公司 | 基于数据分析的在线聊天房间智能推送系统 |
CN116418777B (zh) * | 2023-04-10 | 2024-06-04 | 深圳市逗娱科技有限公司 | 基于数据分析的在线聊天房间智能推送系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11562012B2 (en) | System and method for providing technology assisted data review with optimizing features | |
US10642938B2 (en) | Artificial intelligence based method and apparatus for constructing comment graph | |
US11036791B2 (en) | Computerized system and method for determining non-redundant tags from a user's network activity | |
US10347019B2 (en) | Intelligent data munging | |
US10102254B2 (en) | Confidence ranking of answers based on temporal semantics | |
CN111026671B (zh) | 测试用例集构建方法和基于测试用例集的测试方法 | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
CN108268600B (zh) | 基于ai的非结构化数据管理方法及装置 | |
CN110069698B (zh) | 信息推送方法和装置 | |
US9760828B2 (en) | Utilizing temporal indicators to weight semantic values | |
US9286379B2 (en) | Document quality measurement | |
CN112784063B (zh) | 一种成语知识图谱构建方法及装置 | |
Sharma et al. | NIRMAL: Automatic identification of software relevant tweets leveraging language model | |
CN107239564B (zh) | 一种基于监督主题模型的文本标签推荐方法 | |
CN108228567B (zh) | 用于提取组织机构的简称的方法和装置 | |
CN112749266A (zh) | 一种工业问答方法、装置、系统、设备及存储介质 | |
US20230214679A1 (en) | Extracting and classifying entities from digital content items | |
RU2733481C2 (ru) | Способ и система генерирования признака для ранжирования документа | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
CN113569118B (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN114117239A (zh) | 一种房源推送方法、装置和设备 | |
CN113886545A (zh) | 知识问答方法、装置、计算机可读介质及电子设备 | |
AU2019290658B2 (en) | Systems and methods for identifying and linking events in structured proceedings | |
CN111539208B (zh) | 语句处理方法和装置、以及电子设备和可读存储介质 | |
CN115526177A (zh) | 对象关联模型的训练 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |