CN111383042A - 房源推荐方法和装置 - Google Patents

房源推荐方法和装置 Download PDF

Info

Publication number
CN111383042A
CN111383042A CN201811644038.7A CN201811644038A CN111383042A CN 111383042 A CN111383042 A CN 111383042A CN 201811644038 A CN201811644038 A CN 201811644038A CN 111383042 A CN111383042 A CN 111383042A
Authority
CN
China
Prior art keywords
house source
house
user
knowledge graph
sources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811644038.7A
Other languages
English (en)
Inventor
王贺青
郑开雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beike Technology Co Ltd
Original Assignee
Beike Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beike Technology Co Ltd filed Critical Beike Technology Co Ltd
Priority to CN201811644038.7A priority Critical patent/CN111383042A/zh
Publication of CN111383042A publication Critical patent/CN111383042A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种房源推荐方法和装置。其中,房源推荐方法包括:根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源。本发明实施例提供的房源推荐方法和装置,根据用户的操作日志和房源知识图谱进行用户画像,获取用户的兴趣标签,并根据用户的兴趣标签查询房源知识图谱,确定向用户推荐的房源,使得对用户的刻画更准确,获得的用户的兴趣标签更符合用户的实际需求,从而能获得更符合用户需求的推荐房源,能提高房源推荐的准确性。

Description

房源推荐方法和装置
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种房源推荐方法和装置。
背景技术
伴随着计算机的快速发展,人类进入信息时代;从之前商品短缺、信息缺失和广告缺乏的社会,过渡到现在的商品过剩、信息过度和广告过多的社会;人类从面临着无法多元化选择的困境,到现在又要面临着过多选择的困境甚至因为选择过多而产生无从选择的尴尬场景。
在现实的经济社会中,人类不仅可以通过搜索引擎主动搜索购买商品,还可以被动地接受着由推荐算法所计算出来的,为个体量身定制的各种推荐商品。推荐算法得到快速地发展和应用,在各大场景得到广泛应用,如电商平台的商品推荐、咨询平台的信息推荐、搜索平台的广告推荐、房产行业的房源推荐等等。当前推荐技术按类型可以分为六种:基于关联规则的推荐、基于内容的推荐、基于协同过滤的推荐、基于效用的推荐、基于知识的推荐、组合推荐。
对于房源推荐,上述推荐方法都能在一定程度上能给用户推荐用户感兴趣的房源,但都存在对推荐结果的可解释性差或者无法给出合理的解释,以及存在一些推荐结果用户很反感或者莫名其妙地被推荐了某些房源的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的房源推荐方法和装置。
第一方面,本发明实施例提供一种房源推荐方法,包括:
用户画像步骤,根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;
房源确定步骤,根据所述用户的兴趣标签,查询所述房源知识图谱,确定向用户推荐的房源;
其中,所述房源知识图谱,用于描述房源的信息以及房源之间的关系。
第二方面,本发明实施例提供一种房源推荐装置,包括:
用户画像模块,用于根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;
房源确定模块,用于根据所述用户的兴趣标签,查询所述房源知识图谱,确定向用户推荐的房源;
其中,所述房源知识图谱,用于描述房源的信息以及房源之间的关系。
第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的房源推荐方法。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的房源推荐方法。
本发明实施例提供的房源推荐方法和装置,根据用户的操作日志和房源知识图谱进行用户画像,获取用户的兴趣标签,并根据用户的兴趣标签查询房源知识图谱,确定向用户推荐的房源,使得对用户的刻画更准确,获得的用户的兴趣标签更符合用户的实际需求,从而能获得更符合用户需求的推荐房源,能提高房源推荐的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本发明实施例提供的房源推荐方法的流程示意图;
图2为根据本发明实施例提供的房源推荐装置的功能框图;
图3为根据本发明实施例提供的电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种房源推荐方法和装置,其发明构思是,引入知识图谱技术,将楼盘数据库建模成房源知识图谱,基于知识图谱中两个房源之间的关系和用户的操作行为,对用户进行画像,并根据用户的画像查询房源知识图谱,确定向用户推荐的房源。
图1为根据本发明实施例提供的房源推荐方法的流程示意图。如图1所示,一种房源推荐方法包括:步骤S101、用户画像步骤,根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;其中,房源知识图谱,用于描述房源的信息以及房源之间的关系。
具体地,用户的操作日志,指用户在房产交易平台上的操作日志。操作日志至少包括搜索日志或者至少包括点击日志。搜索日志,用于记录用户进行房源检索时输入的检索词和房产交易平台返回的检索结果。点击日志,用于记录用户通过点击操作查看的房源的信息。
房源知识图谱,指针对房源建立的知识图谱。
知识图谱(Knowledge Graph,简称KG)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。它能将复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
从学术的角度,知识图谱可以定义为“知识图谱本质上是语义网络(SemanticNetwork)的知识库”。从实际应用的角度出发,可以简单地把知识图谱理解成多关系图(Multi-relational Graph)。
图(Graph)是由节点(Vertex)和边(Edge)来构成,但普通的图通常只包含一种类型的节点和边。但相反,多关系图一般包含多种类型的节点和多种类型的边。多关系图中,节点或边的类型可以由不同颜色、不同线型等进行标记。
在知识图谱里,通常用“实体(Entity)”来表达多关系图中的节点、用“关系(Relation)”来表达多关系图里的“边”。实体指的是现实世界中的事物比如人、地名、概念、药物、公司等,关系则用来表达不同实体之间的某种联系,比如人-“居住在”-北京、张三和李四是“朋友”、逻辑回归是深度学习的“先导知识”等等。
在现实世界中,实体和关系也会拥有各自的属性,比如人可以有“姓名”和“年龄”。当一个知识图谱拥有属性时,可以用属性图(Property Graph)来表示。
将房源作为知识领域,通过对与房源有关的数据的挖掘、统计、融合、推理、清洗等数据处理方法,得到与房源有关的知识,并将上述与房源有关的知识通过图形绘制显示出来,就可以获得房源知识图谱。因此,房源知识图谱,描述了每一房源的信息,以及存在关系的每两个房源之间的关系。
房源有关的知识,除了包括每一房源的面积、户型、楼层、价格、周围设施、年限等房源自身的信息之外,还包括两个房源之间存在的关系。因此,房源知识图谱中,房源可以作为一种实体,房源的面积、户型、楼层、价格、周围设施、年限等房源自身的信息和特征可以作为实体的属性,两个房源之间存在的共性(例如位于同一小区、均位于地铁站附近、户型均为一室一厅等)可以作为关系,关系也具有属性(例如位置关系、价格关系等)。
可以理解的是,用户搜索房源或点击查看房源说明用户对该房源的至少一个属性或特征感兴趣,用户搜索房源的关键词说明用户对该关键词描述的一类房源感兴趣;根据预先建立的房源知识图谱,对用户的操作日志涉及的房源进行分析,根据用户的操作日志涉及的房源的属性、房源之间的关系和房源之间的关系的属性,获得用户的操作日志涉及的房源的若干个具有共性的属性和/或特征,作为用户的兴趣标签。
用户的操作日志涉及的房源,包括符合搜索关键词的房源和用户查看的房源。
兴趣标签(又称倾向标签),用于表示用户感兴趣或有倾向的房源的属性或特征。由于房源的属性和特征很多,通常用户的兴趣标签至少有一个。
上述获取用户的兴趣标签的过程,为用户画像的过程。用户的兴趣标签,可以反映用户对房源的需求。
步骤S101可以通过离线或在线方式执行。
步骤S102、房源确定步骤,根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源。
具体地,获得用户的兴趣标签之后,根据用户的兴趣标签查询房源知识图谱,获得符合用户的兴趣标签的房源,作为向用户推荐的房源。
可以根据房源所具有的用户的兴趣标签的数量,将所具有用户的兴趣标签的数量符合预设的条件的房源,作为符合用户的兴趣标签的房源。
例如,用户的兴趣标签有5个,若预设的条件为不具有的兴趣标签至多一个,则可以将所具有的用户的兴趣标签的数量为4个和5个的房源均符合用户的兴趣标签的房源;用户的兴趣标签有8个,若预设的条件为具有的用户的兴趣标签的数量与用户的兴趣标签的总数之比大于或等于75%,则可以将所具有的用户的兴趣标签的数量为6个至8个的房源均符合用户的兴趣标签的房源。
本发明实施例根据用户的操作日志和房源知识图谱进行用户画像,获取用户的兴趣标签,并根据用户的兴趣标签查询房源知识图谱,确定向用户推荐的房源,使得对用户的刻画更准确,获得的用户的兴趣标签更符合用户的实际需求,从而能获得更符合用户需求的推荐房源,能提高房源推荐的准确性。
基于上述各实施例的内容,用户画像步骤具体包括:根据用户的操作日志,获取用户感兴趣的房源;根据用户感兴趣的房源,查询房源知识图谱,获取用户的兴趣标签。
具体地,可以将全部或部分用户的操作日志涉及的房源,作为用户感兴趣的房源。
例如,对于用户的点击日志涉及的房源,说明用于通过点击查看了上述房源的详细信息,表示用户对上述房源表现出来一定的兴趣或倾向,可以将上述房源作为用户感兴趣的房源。
获取用户感兴趣的房源后,根据预先建立的房源知识图谱,对用户感兴趣的房源进行分析,根据用户感兴趣的房源的属性、房源之间的关系和房源之间的关系的属性,获得用户感兴趣的房源的若干个具有共性的属性和/或特征,作为用户的兴趣标签。
本发明实施例根据用户的操作日志和房源知识图谱进行用户画像,获取用户的兴趣标签,能更准确地勾画用户对房源的具体需求,获得的用户的兴趣标签更符合用户的实际需求。
基于上述各实施例的内容,根据用户感兴趣的房源,查询房源知识图谱,获取用户的兴趣标签的具体步骤包括:对于用户感兴趣的房源中的任意两个房源,查询房源知识图谱,获取两个房源之间的关系;根据用户感兴趣的房源中各房源两两之间的关系,获取用户的兴趣标签。
具体地,获得用户感兴趣的房源后,获取用户感兴趣的房源中各房源两两之间的关系。
对于用户感兴趣的房源中的任意两个房源,以上述两个房源的唯一标识(例如房源的ID)为查询条件,获取上述两个房源之间的关系。
例如,房产交易平台显示房源1的属性包括:价格525万元、面积55.43平方米、朝向西北、年代1990年、挂牌时间2018-05-22,房源2的属性包括:面积560万元、面积57.32平方米、朝向南北、年代1991年、挂牌时间2018-05-03;通过查询房源知识图谱,获得二者之间的关系为:产权年限都是50年产权、交易属性都是军产、房源都是临街的、房屋朝向都是北。
获得用户感兴趣的房源中各房源两两之间的关系之后,分析用户感兴趣的房源中各房源两两之间的关系,可以确定用户感兴趣的房源属性和特征,将用户感兴趣的房源属性和特征确定为用户的兴趣标签。
例如:用户感兴趣的房源为房源A、房源B和房源C,房源A的属性和特征包括:价格370万、学区房、中层楼;房源B的属性和特征包括:价格350万、近地铁、中高层;房源C的属性和特征包括:价格400万、近地铁、学区房;通过查询房源知识图谱,获得房源A和房源B之间的关系为:均为中高层、价格区间均位于350-400万,房源A和房源C之间的关系为:均为学区房、价格区间均位于350-400万,房源B和房源C之间的关系为:均为近地铁、价格区间均位于350-400万;分析房源A、房源B和房源C两两之间的关系,可以获知用户更倾向于价格350-400万、地铁房、学区房、中高层楼的房源,将价格350-400万、地铁房、学区房、中高层楼确定为用户的兴趣标签。
本发明实施例根据用户感兴趣的房源中各房源两两之间的关系,获取用户的兴趣标签,能更准确地勾画用户对房源的具体需求,获得的用户的兴趣标签更符合用户的实际需求。
基于上述各实施例的内容,房源确定步骤之后还包括:将用户的兴趣标签,作为确定用户推荐的房源的推荐理由,并输出推荐理由。
可以理解的是,确定向用户推荐的房源之后,可以输出向用户推荐的房源,并向用户显示上述推荐的房源,实现房源推荐数据的可视化。在向用户显示推荐的房源的同时,还可以输出推荐上述推荐的房源的推荐理由,并向用户显示,帮助用户理解推荐结果。
可以将用户的兴趣标签,作为确定用户推荐的房源的推荐理由。因此,显示的推荐理由为用户的兴趣标签。
需要说明的是,可以在显示推荐理由时,将作为推荐理由的用户的兴趣标签设置“选择/取消选择”按钮,兴趣标签可以作为搜索关键词提示用户,用户如果不认可某个兴趣标签,可以取消对该兴趣标签的选择;用户如果认为还有其他推荐理由,可以手动选择其他标签也作为推荐理由;通过用户的选择或取消选择,可以确定该用户新的兴趣标签,再次执行步骤S102,即根据新的兴趣标签查询房源知识图谱,重新确定向用户推荐的房源。
由于用户可以纠正推荐理由,用户和推荐方法一起朝着一个更好的方向进化,使得用户真实意图得到挖掘,获得用户想要的房源,推荐结果让用户更容易接受,并能帮助用户主动搜索更好的结果。
本发明实例通过输出推荐理由,增强了房源推荐方法的可解释性,推荐有理有据,并且能够实现与用户之间的交互反馈,不断迭代获得更加符合用户心愿的房源推荐结果。
基于上述各实施例的内容,建立房源知识图谱的具体步骤包括:获取与房源有关的原始数据,并对原始数据进行挖掘,获取扩展数据;抽取扩展数据中的实体、实体之间的关系、实体的属性和属性值;对于同一实体,将不同来源的扩展数据进行知识融合;对知识融合后的扩展数据进行知识推理,获得房源知识库;根据房源知识库,建立房源知识图谱;其中,实体至少包括房源。
具体地,房源知识图谱的建立过程也可称知识图谱生产。
可以理解的是,知识图谱生产之前,先进行本体库建模,生成本体库。
知识图谱在逻辑上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。可以用(实体1,关系,实体2)或(实体、属性,属性值)这样的三元组来表达事实。模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。
生成本体库的具体步骤包括:领域业务和数据理解、定义实体类型、定义实体属性、定义实体关系和生成本体库。
领域业务和数据理解,具体包括通过调研房产交易业务,结合楼盘数据库,确定本体类型范围。本体涉及五大类:人、地点、建筑、组织机构、交通,采用“自顶向下”与“自底向上”相结合的思想进行本体库构建。
定义实体类型,具体包括结合房产交易业务和楼盘数据库,可以从楼盘数据库中抽象出包括房源在内的多种实体类型,基于本体库编辑软件,进行实体类型建模。实体类型可达32种,但不限于此,根据实际情况还可以多于或少于32种。本体库编辑软件可以采用Protégé、Apollo、WebOnto、WebODE和OntoEdit等本体库编辑软件,对于具体采用的本体库编辑软件,本发明实施例不作限制。
定义实体属性,具体包括结合房产交易业务和楼盘数据库,为每种实体定义属性。
定义实体关系,具体包括结合房产交易业务和楼盘数据库,为两个实体中间建立关联关系。
完成实体类型、实体属性、实体关系的定义之后,可以根据实体类型、实体属性、实体关系,生成本体库。
房源知识图谱生产分为信息抽取、知识表示、知识融合、知识推理四个过程,每一次更新迭代均包含这四个阶段。
由于与房源有关的信息非常多样,可以先通过互联网或房产交易平台获取与房源有关的原始数据,实现房源的信息抽取。进行房源的信息抽取之后,可以对原始数据进行挖掘,即以原始数据为数据源,对原始数据进行扩展,获得扩展数据,实现异构数据。原始数据,通常包括三种类型:结构化数据、半结构化数据、非结构化数据。
知识表示,也称为知识抽取。对于扩展数据中的结构化数据,数据中的实体、实体之间的关系、实体的属性和属性值已经进行了结构化保存;对于扩展数据中的半结构化数据和非结构化数据,则抽取三元组,即抽取数据中的实体、实体之间的关系、实体的属性和属性值。
知识融合,指将不同来源的同一实体数据进行融合,具体涉及属性名和属性值归一化、实体对齐、实体链接、实体固化。
对知识融合后的扩展数据进行知识推理,具体可以基于推理计算,补充增加相关信息,主要包括实体关系补全、实体属性补全、pagerank排序字段推理、规则推理等。
知识推理之后,即可获得房源知识库。将房源知识库可视化,即可获得房源知识图谱。
对于房源知识图谱生产中的信息抽取、知识表示、知识融合、知识推理的四个步骤,以及上述四个步骤的子步骤,可以采用现有技术中的合适方法实现。对此,本发明实施例不作具体限制。
可以理解的是,获得房源知识图谱后,还需要进行房源知识图谱存储,以便于在进行房源推荐时应用房源知识图谱。可以采用图形数据方式对房源知识图谱进行存储,可以采用当前现有任一图形数据库(以当前比较流行的Neo4j图形数据库为例),根据本体库将房源知识图谱数据格式转换成Neo4j需求的数据格式,还可以采用neo4j-import批量更新和cyphersql增量更新两种方法相结合的方式进行数据更新。可以基于Spark分布式计算技术,建立TB级大数据处理流程,满足小时级的数据处理更新,实现房源知识图谱的更新。采用Neo4j图形数据库,满足对节点查找的平均响应时间在10ms以内,满足对关系查找的平均响应时间在100ms,因而能够更加快速的获得房源推荐结果。
本发明实施例根据房源有关的原始数据及其扩展数据建立房源知识图谱,数据丰富,能尽可能多地获取房源之间的关系,使得房源知识图谱更加全面,从而能基于房源知识图谱获得更加符合用户需求的房源推荐结果。
基于上述各实施例的内容,与房源有关的原始数据至少包括:楼盘数据库、用户与房屋经纪人的对话数据、互联网数据中与房源有关的数据。
具体地,与房源有关的原始数据至少包括:楼盘数据库。
楼盘数据库,收录了包括房源房间门牌号、标准户型图、属性信息、配套设施信息、历史业务数据等多维度信息。
房源的属性和特征,还可以通过其他数据反映,如用户与房屋经纪人的对话数据、互联网数据中与房源有关的数据。
互联网数据中与房源有关的数据包括但不限于:百科,问答,新闻、自媒体、论坛中涉及房源的数据。
本发明实施例通过互联网获取与房源有关的原始数据,进一步扩展了数据来源,使得房源知识图谱更加全面,从而能基于房源知识图谱获得更加符合用户需求的房源推荐结果。
基于上述各实施例的内容,对原始数据进行挖掘,获取扩展数据的具体步骤包括:根据与房源有关的原始数据中用于描述房源的文本信息,获取房源的属性。
具体地,可以对与房源有关的原始数据中用于描述房源的文本信息进行挖掘,获得房源的属性,作为扩展数据。
互联网数据中与房源有关的数据多为文本信息,如百科,问答,新闻、自媒体、论坛中涉及房源的数据均为文本信息。
可以提取上述文本数据中的描述房源的语句,对上述语句进行结构化挖掘,确定房源的属性(或标签),从而实现对原始数据的挖掘和扩展。
例如,某段描述房源D的文本信息中出现附近有超市、附近有小学、距离地铁站5分钟等,可以确定房源D的属性包括近超市、近学校、近地铁。
本发明实施例通过对文本信息进行结构化挖掘,获取房源的标签,能标记房源的特征,从而能准确进行用户画像,获得更加符合用户需求的房源推荐结果。
图2为根据本发明实施例提供的房源推荐装置的功能框图。基于上述各实施例的内容,如图2所示,该房源推荐装置包括用户画像模块201和房源确定模块202,其中:
用户画像模块201,用于根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;
房源确定模块202,用于根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源;
其中,房源知识图谱,用于描述房源的信息以及房源之间的关系。
具体地,用户画像模块201根据预先建立的房源知识图谱,对用户的操作日志涉及的房源进行分析,根据用户的操作日志涉及的房源的属性、房源之间的关系和房源之间的关系的属性,获得用户的操作日志涉及的房源的若干个具有共性的属性和/或特征,作为用户的兴趣标签。
房源确定模块202根据用户的兴趣标签查询房源知识图谱,获得符合用户的兴趣标签的房源,作为向用户推荐的房源。
本发明实施例提供的房源推荐装置,用于执行本发明实施例提供的房源推荐方法,该房源推荐装置包括的各模块实现相应功能的具体方法和流程详见上述房源推荐方法的实施例,此处不再赘述。
该房源推荐装置用于前述各实施例的房源推荐方法。因此,在前述各实施例中的房源推荐方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例根据用户的操作日志和房源知识图谱进行用户画像,获取用户的兴趣标签,并根据用户的兴趣标签查询房源知识图谱,确定向用户推荐的房源,使得对用户的刻画更准确,获得的用户的兴趣标签更符合用户的实际需求,从而能获得更符合用户需求的推荐房源,能提高房源推荐的准确性。
图3为根据本发明实施例提供的电子设备的结构框图。基于上述实施例的内容,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例所提供的方法,例如包括:根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;根据用户的兴趣标签,查询房源知识图谱,确定向用户推荐的房源。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种房源推荐方法,其特征在于,包括:
用户画像步骤,根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;
房源确定步骤,根据所述用户的兴趣标签,查询所述房源知识图谱,确定向用户推荐的房源;
其中,所述房源知识图谱,用于描述房源的信息以及房源之间的关系。
2.根据权利要求1所述的房源推荐方法,其特征在于,所述用户画像步骤具体包括:
根据所述用户的操作日志,获取用户感兴趣的房源;
根据所述用户感兴趣的房源,查询所述房源知识图谱,获取所述用户的兴趣标签。
3.根据权利要求2所述的房源推荐方法,其特征在于,所述根据所述用户感兴趣的房源,查询所述房源知识图谱,获取所述用户的兴趣标签的具体步骤包括:
对于所述用户感兴趣的房源中的每两个房源,查询所述房源知识图谱,获取所述两个房源之间的关系;
根据所述用户感兴趣的房源中各房源两两之间的关系,获取所述用户的兴趣标签。
4.根据权利要求1所述的房源推荐方法,其特征在于,所述房源确定步骤之后还包括:
将所述用户的兴趣标签,作为确定用户推荐的房源的推荐理由,并输出所述推荐理由。
5.根据权利要求1至4任一所述的房源推荐方法,其特征在于,建立所述房源知识图谱的具体步骤包括:
获取与房源有关的原始数据,并对所述原始数据进行挖掘,获取扩展数据;
抽取所述扩展数据中的实体、实体之间的关系、实体的属性和属性值;
对于同一实体,将不同来源的所述扩展数据进行知识融合;
对知识融合后的所述扩展数据进行知识推理,获得房源知识库;
根据所述房源知识库,建立所述房源知识图谱;
其中,实体至少包括房源。
6.根据权利要求5所述的房源推荐方法,其特征在于,所述与房源有关的原始数据至少包括:
楼盘数据库、用户与房屋经纪人的对话数据、互联网数据中与房源有关的数据。
7.根据权利要求5所述的房源推荐方法,其特征在于,对所述原始数据进行挖掘,获取扩展数据的具体步骤包括:
根据与房源有关的原始数据中用于描述房源的文本信息,获取房源的属性。
8.一种房源推荐装置,其特征在于,包括:
用户画像模块,用于根据用户的操作日志和预先建立的房源知识图谱,获取用户的兴趣标签;
房源确定模块,用于根据所述用户的兴趣标签,查询所述房源知识图谱,确定向用户推荐的房源;
其中,所述房源知识图谱,用于描述房源的信息以及房源之间的关系。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至7任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。
CN201811644038.7A 2018-12-30 2018-12-30 房源推荐方法和装置 Pending CN111383042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811644038.7A CN111383042A (zh) 2018-12-30 2018-12-30 房源推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811644038.7A CN111383042A (zh) 2018-12-30 2018-12-30 房源推荐方法和装置

Publications (1)

Publication Number Publication Date
CN111383042A true CN111383042A (zh) 2020-07-07

Family

ID=71219455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811644038.7A Pending CN111383042A (zh) 2018-12-30 2018-12-30 房源推荐方法和装置

Country Status (1)

Country Link
CN (1) CN111383042A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395507A (zh) * 2020-12-07 2021-02-23 深圳市房多多网络科技有限公司 房源信息的推荐方法、装置、设备及可读存储介质
CN112905903A (zh) * 2021-04-06 2021-06-04 北京百度网讯科技有限公司 一种租房推荐方法、装置、电子设备及存储介质
CN115858930A (zh) * 2022-12-09 2023-03-28 贝壳找房(北京)科技有限公司 基于编码的信息查询方法、设备、介质及计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240163A (zh) * 2014-09-28 2014-12-24 百度在线网络技术(北京)有限公司 一种小区智能推荐方法及装置
CN106528785A (zh) * 2016-11-03 2017-03-22 杜剑峰 基于问题合成的用户租房偏好捕获方法
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN108256024A (zh) * 2018-01-10 2018-07-06 链家网(北京)科技有限公司 一种房源推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240163A (zh) * 2014-09-28 2014-12-24 百度在线网络技术(北京)有限公司 一种小区智能推荐方法及装置
CN106528785A (zh) * 2016-11-03 2017-03-22 杜剑峰 基于问题合成的用户租房偏好捕获方法
CN107688606A (zh) * 2017-07-26 2018-02-13 北京三快在线科技有限公司 一种推荐信息的获取方法及装置,电子设备
CN108256024A (zh) * 2018-01-10 2018-07-06 链家网(北京)科技有限公司 一种房源推荐方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112395507A (zh) * 2020-12-07 2021-02-23 深圳市房多多网络科技有限公司 房源信息的推荐方法、装置、设备及可读存储介质
CN112905903A (zh) * 2021-04-06 2021-06-04 北京百度网讯科技有限公司 一种租房推荐方法、装置、电子设备及存储介质
CN115858930A (zh) * 2022-12-09 2023-03-28 贝壳找房(北京)科技有限公司 基于编码的信息查询方法、设备、介质及计算机程序产品
CN115858930B (zh) * 2022-12-09 2024-02-20 贝壳找房(北京)科技有限公司 基于编码的信息查询方法、设备、介质及计算机程序产品

Similar Documents

Publication Publication Date Title
US11704595B2 (en) Cognitive search operation
Zhang et al. Big data-assisted social media analytics for business model for business decision making system competitive analysis
Netzer et al. Mine your own business: Market-structure surveillance through text mining
Alaimo From people to objects: the digital transformation of fields
Alag Collective intelligence in action
Khoshfetrat et al. Critical risk factors for implementing building information modelling (BIM): a Delphi-based survey
US9141966B2 (en) Opinion aggregation system
Kangale et al. Mining consumer reviews to generate ratings of different product attributes while producing feature-based review-summary
Khoa The impact of chatbots on the relationship between integrated marketing communication and online purchasing behavior in the frontier market
US20100332465A1 (en) Method and system for monitoring online media and dynamically charting the results to facilitate human pattern detection
US20130204822A1 (en) Tools and methods for determining relationship values
Mirvahedi et al. The role of serendipity in opportunity exploration
US11599927B1 (en) Artificial intelligence system using deep neural networks for pairwise character-level text analysis and recommendations
US11574123B2 (en) Content analysis utilizing general knowledge base
KR102458510B1 (ko) 실시간 보완 가능한 마케팅 시스템
CN111383042A (zh) 房源推荐方法和装置
Herrmann et al. # fridaysforfuture–What does Instagram tell us about a social movement?
Koenig et al. Effects of design characteristics on corporate blog acceptance
Nguyen et al. A bibliometric analysis of research on tourism content marketing: Background knowledge and thematic evolution
US20170132728A1 (en) Method and system of automatically generating an online-real estate magazine
CN114266443A (zh) 数据评估方法和装置、电子设备、存储介质
Wong et al. Learning to extract and summarize hot item features from multiple auction web sites
Celuch Customers' experience of purchasing event tickets: mining online reviews based on topic modeling and sentiment analysis
Xia et al. Smart recommendation for tourist hotels based on multidimensional information: a deep neural network model
Daoud et al. The role of competitive advantage between search engine optimization and shaping the mental image of private Jordanian University students using google

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination