CN110633381B - 一种识别虚假房源的方法、装置、存储介质及电子设备 - Google Patents
一种识别虚假房源的方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN110633381B CN110633381B CN201811592900.4A CN201811592900A CN110633381B CN 110633381 B CN110633381 B CN 110633381B CN 201811592900 A CN201811592900 A CN 201811592900A CN 110633381 B CN110633381 B CN 110633381B
- Authority
- CN
- China
- Prior art keywords
- house source
- picture
- house
- characteristic information
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012795 verification Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000007689 inspection Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供一种识别虚假房源的方法、装置、存储介质及电子设备,其中,该方法包括:获取新录入房源的房源图片和房源特征信息;将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。实现根据已有真实房源特征信息验证新获取的房源特征信息的真伪的效果,避免将虚假房源的相关信息发布到网络平台,有效地减少虚假房源被上传网络平台的概率,提高了网络平台中展示的房产信息的准确度,提升了该网络平台的用户黏度。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种识别虚假房源的方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的发展,网络提供给用户的信息越来越丰富。例如,用户可以通过网络平台浏览房产信息,从而满足租房或买房的需求。
目前,网络平台上展示的房产信息,通常是由房产中介公司内的房产经纪人上传的。房产中介公司对房产经纪人的考核指标可能包括房源录入次数、以及售出房源套数等指标。由于涉及到业绩考核,一些房产经纪人可能会录入一些虚假的房源来满足考核要求,而对于这些虚假的房源的相关信息,若未经过仔细的勘察检验,会被认为是真实房源而最终展示到网络平台上供用户浏览,为用户购置房产带来了不必要的麻烦,进而影响网络平台的用户黏度。
发明内容
本公开实施例提供一种识别虚假房源的方法、装置、存储介质及电子设备,可以鉴别新录入的房源的真伪,有效地减少虚假房源被上传到网络平台的概率。
第一方面,本公开实施例提供了一种识别虚假房源的方法,包括:
获取新录入房源的房源图片和房源特征信息;
将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;
在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。
进一步的,在确定新录入的所述房源为真实房源之后,还包括:
将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识。
进一步的,所述鉴别图集是真实房源的标准房源图片的集合;
在构建所述鉴别图集时,将真实房源的房源特征信息与所述标准房源图片进行关联存储。
进一步的,将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片,包括:
基于所述房源特征信息由鉴别图集中查询参考标准图片;
计算所述房源图片和所述参考标准图片的相似度;
在所述相似度超过设定阈值时,确定所述参考标准图片是目标标准图片。
进一步的,计算所述房源图片和所述参考标准图片的相似度,包括:
基于所述房源图片包含的目标对象将所述房源图片划分为至少两个子图片;
分别将所述子图片与所述参考标准图片中具有相同目标对象的子区域进行匹配;
根据匹配结果为所述参考标准图片打分,根据得分确定所述房源图片和所述参考标准图片的相似度。
进一步的,在基于所述目标对象由鉴别图集中查询包含相同目标对象的参考标准图片之后,还包括:
在所述鉴别图集中不包括具有相同目标对象的参考标准图片时,输出建议进行人为验证处理的提示信息;
若检测到人为验证结果为新录入的房源是真实房源,则获取新录入的所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集。
进一步的,所述方法还包括:
在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息。
第二方面,本公开实施例还提供了一种识别虚假房源的装置,该装置包括:
信息获取模块,用于获取新录入房源的房源图片和房源特征信息;
图片匹配模块,用于将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;
房源鉴别模块,用于在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。
进一步的,所述装置还包括:房源标识关联模块,用于在所述房源鉴别模块确定新录入的所述房源为真实房源之后,将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识。
进一步的,所述鉴别图集是真实房源的标准房源图片的集合;在构建所述鉴别图集时,将真实房源的房源特征信息与所述标准房源图片进行关联存储。
进一步的,所述图片匹配模块,包括:
标准图片查询单元,用于基于所述房源特征信息由鉴别图集中查询参考标准图片;
图片相似度计算单元,用于计算所述房源图片和所述参考标准图片的相似度;
目标标准图片确定单元,用于在所述相似度超过设定阈值时,确定所述参考标准图片是目标标准图片。
进一步的,所述图片匹配模块,还包括:
子图片划分单元,用于基于所述房源图片包含的目标对象将所述房源图片划分为至少两个子图片;
子区域匹配单元,用于分别将所述子图片与所述参考标准图片中具有相同目标对象的子区域进行匹配;
相似度确定单元,用于根据匹配结果为所述参考标准图片打分,根据得分确定所述房源图片和所述参考标准图片的相似度。
进一步的,所述装置还包括:
提示信息提取模块,用于在所述图片匹配模块基于所述目标对象由鉴别图集中查询包含相同目标对象的参考标准图片之后,在所述鉴别图集中不包括具有相同目标对象的参考标准图片时,输出建议进行人为验证处理的提示信息;
鉴别图集更新模块,用于若检测到人为验证结果为新录入的房源是真实房源,则获取新录入的所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集。
进一步的,所述装置还包括:虚假房源确定模块,用于在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息。
第三方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的识别虚假房源的方法。
第四方面,本公开实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本公开实施例所述的识别虚假房源的方法。
本公开实施例提供一种识别虚假房源的方案,将新录入房源的房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;在新录入房源的房源特征信息与目标标准图片的标准房源特征信息相同时,确定新录入的房源为真实房源。采用本公开实施例的技术方案,通过将新录入房源的房源特征信息和与其图像匹配的真实房源的标准房源特征信息进行比对的方式,实现根据已有真实房源特征信息验证新获取的房源特征信息的真伪的效果,避免通过修改房源描述信息未修改房源照片得到的虚假房源被发布到网络平台的情况发生,有效地减少虚假房源被上传网络平台的概率,提高了网络平台中展示的房产信息的准确度,提升了该网络平台的用户黏度。
附图说明
图1是本公开实施例中的一种识别虚假房源的方法流程图;
图2是本公开实施例中的一种鉴别图集的结构示意图;
图3是本公开实施例中的另一种识别虚假房源的方法流程图;
图4是本公开实施例中的一种识别虚假房源的装置结构示意图;
图5是本公开实施例中的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
图1为本公开实施例提供的一种识别虚假房源的方法流程图,本实施例可适用于识别仅修改房源特征信息得到的虚假房源的情况,该方法可以由识别虚假房源的装置来执行,该装置可以采用硬件和/或软件实现,并可以配置于电子设备执行,该方法具体包括如下步骤:
S110、获取新录入房源的房源图片和房源特征信息。
具体的,房源的录入可以是房产中介公司内的房产经纪人输入或上传的房产信息,而新录入的房源可以是已经录入但是未经过检验房源信息是否真实的房源或是需要验证真伪的房源信息。示例性的,新录入的房源可以是二手房的房源。录入的房源信息可以包括房源的房源图片和房源特征信息。其中,房源图片可以是与该房源的房产相关的图片,比如室内构造的示意图图片、室内实景图片等。房源特征信息是对房源进行描述的信息,可以包括房源标识和房源基本信息。房源标识即房源ID,记为source_id,该房源ID可以说明该条房源记录的来源,如属于哪家公司和/或哪个经纪人录入。房源信息可以是用于对房产具体信息的描述,例如房产的朝向、位置、楼层和几室几厅之类的信息。可以通过上述房源基本信息唯一代表一条房源记录,对应于现实中的一个真实房源。
S120、将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片。
其中,鉴别图集可以是预先利用已经通过验证且为真实房源的标准房源图片构建的图集,如中介房产公司的经纪人已经通过线下查验,验证了房源图片以及房源特征信息的真实性,则相应房源的房源图片可以作为真实房源的标准图片,将上述标准图片与房源特征信息进行关联,并将该标准图片添加至鉴别图集中。
对于新录入的房源图片,可以将房源图片与鉴别图集中的真实房源的标准图片进行匹配,如可以将新录入的房源图片与标准图片一一比较,将与新录入的房源图片匹配的真实房源的标准图片作为目标标准图片。可选的,可以比较图片的整个图像,也可以匹配局部的图像。若新录入的房源图片与真实房源的标准图片具有相同的家具或者具有相同的室内装饰,则将该标准图片标记为与新录入的房源图片匹配的目标标准图片。示例性的,若新录入的图片中包括某件家具,则可以通过匹配确定包括同样家具的标准图片为目标标准图片。此外,若新录入的房源图片与真实房源的标准图片的相似度超过预设阈值,则可以确定该标准图片是与新录入的房源图片匹配的目标标准图片。例如,可以采用感知哈希算法分别为新录入的房源图片和标准图片生成一个“指纹”字符串,然后,计算新录入的房源图片的“指纹”字符串与标准图片的“指纹”字符串中相同位置上相同的字符的数量,将该数量与整个字符串的长度的比值作为新录入的房源图片与真实房源的标准图片的相似度。需要说明的是,字符串越接近,图片之间的相似度越高。若该相似度超过预设阈值,则确定该标准图片是与新录入的房源图片匹配的目标标准图片。其中,预设阈值可以根据能够判定两幅图片相同的最小比值(即“指纹”字符串中相同位置上相同的字符的数量与整个字符串数量的比值)确定。
S130、在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。
示例性的,可以预先建立标准图片与房源特征信息的映射关系,根据目标标准图片以及映射关系确定对应的房源特征信息。如果所述目标标准图片对应的房源特征信息与所述新录入的房源特征信息相同或相似,则可以确定新录入的所述房源为真实房源。例如,若新录入房源的各个房源特征信息均与标准房源的各个房源特征信息相同,则确定该新录入的房源为真实房源。若新录入房源的房源特征信息与标准房源的房源特征信息基本上相同,但房源所属小区不同,可以通过检测房源所属小区的名字中的文字重合度是否超过设定阈值的方式,判断该新录入房源与标准房源的名字是否是简称与全称的关系。若是,则确定该新录入的房源为真实房源;否则,确定该新录入的房源为虚假房源。
本公开实施例的技术方案,通过将新录入房源的房源特征信息和与其图像匹配的真实房源的标准房源特征信息进行比对的方式,实现根据已有真实房源特征信息验证新获取的房源特征信息的真伪的效果,避免通过修改房源描述信息未修改房源照片得到的虚假房源被发布到网络平台的情况发生,有效地减少虚假房源被上传网络平台的概率,提高了网络平台中展示的房产信息的准确度,提升了该网络平台的用户黏度。
可选的,在确定新录入的所述房源为真实房源之后,所述方法还包括:
将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识。
具体的,将属于同一房源且为真实房源的新录入的房源ID(source_id)与已经录入且上线或在售的房源ID(online_id)进行关联,例如可以建立映射关系,将source_id关联至online_id,可以了解到该房源被哪些房产中介以及经纪人录入的情况,且便于进行信息同步。示例性的,如果不同房产中介中的经纪人针对某一个房源修改了房源价格,可以同步修改与该条房源的online_id关联的多个source_id对应的房源的房源价格。
可选的,所述鉴别图集是真实房源的标准房源图片的集合;在构建所述鉴别图集时,将真实房源的房源特征信息与所述标准房源图片进行关联存储。
其中,鉴别图集是真实房源的标准房源图片的集合。不同的标准图片可以有对应的标识,鉴别图集中可以包括标准图片的标识以及对应的房源ID。图2是本公开实施例提供的一种鉴别图集的结构示意图,如图2所示,在鉴别图集中存储的房源ID可以与对应的房源图片建立映射关系,如房源ID1对应图片1,图片2和图片3。当然,也可以预先建立标准图片标识与房源特征信息的映射关系,比如标准图片1对应的房源特征信息是C市A区的几号楼的哪户。或者可以根据目标标准图片的标识从预先建立的数据库中获取与目标标准图片对应的房源特征信息,数据库中可以存储了大量的标准图片标识以及对应的房源特征信息。
可选的,所述方法还包括:
在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息。
示例性的,如果新录入的房源图片与真实房源对应的标准图片匹配,但是房源特征信息不相同时,即新录入的房源图片的房源特征信息与标准图片的房源特征信息不匹配,则可以认为该新录入的房源为虚假房源,这种情况可能是经纪人直接复制了已经上线的房源图片作为新录入的房源特征信息对应的图片,并简单修改真实房源的房源特征信息后重新发布一个伪造的房源,可以将该新录入的房源确认为虚假房源。
图3是本公开实施例提供的另一种识别虚假房源方法的流程图,在上述实施例的基础上,可选的,对该方法作了进一步的优化,如图3所示,该方法包括:
S310、获取新录入房源的房源图片和房源特征信息。
S320、基于所述房源特征信息由鉴别图集中查询参考标准图片。
根据新录入房源的房源特征信息可以查询对应的参考信息,比如根据房源特征信息中的地址信息在鉴别图集中查找地址相同的真实房源对应的图片,并将该图片作为参考标准图片。其中,参考标准图片可能是一张或多张。
例如,可以根据房源所属小区由鉴别图集中获取与该房源所属小区相同的参考标准图片。又如,可以根据户型由鉴别图集中获取与该户型相同的参考标准图片。
S330、计算所述房源图片和所述参考标准图片的相似度。
示例性的,计算所述房源图片和所述参考标准图片的相似度包括:基于所述房源图片包含的目标对象将所述房源图片划分为至少两个子图片;分别将所述子图片与所述参考标准图片中具有相同目标对象的子区域进行匹配;根据匹配结果为所述参考标准图片打分,根据得分确定所述房源图片和所述参考标准图片的相似度。
其中,房源图片包含的目标对象可以是图片中室内的家具及电器信息等,如可以将家具作为目标对象。可以基于目标对像对新录入的房源图片进行分割,得到至少两个子图片。将包含目标对象的子图片与所述参考标准图片中具有相同目标对象的子区域进行比较。当然可以根据业务需要或电子设备的性能情况设置比较一张或多张子图片与参考标准图片之间的匹配情况。例如,为了减少计算量,可以只匹配家具或家电这些更明显的目标对象。
进一步的,可以根据匹配结果为参考标准图片打分,例如,可以根据目标对象的匹配情况进行打分,具体的打分规则可以预先进行设定。示例性的,一张子图片匹配,可以为参考标准图片打1分;若两张子图片匹配,可以为参考标准图片打2分。然后可以根据参考标准图片的得分确定与房源图片的相似度,示例性的,得分越高,相似度越高。
S340、判断所述相似度是否超过设定阈值,若是,则执行步骤350,否则执行步骤390。
需要说明的是,设定阈值是可以判定两幅图片相同的最小分值。
S350、确定所述参考标准图片是目标标准图片。
当计算得到参考标准图片与新录入的房源图片之间的相似度超过预定阈值时,则可以将该参考标准图片作为目标标准图片。
S360、判断所述房源特征信息与所述目标标准图片对应的标准房源特征信息是否相同,若是,则执行步骤370,否则执行步骤380。
S370、确定新录入的所述房源为真实房源,将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识。
S380、确定新录入的所述房源为虚假房源,删除该新录入房源的房源图片和房源特征信息。
若确定该新录入房源为虚假房源,则删除该新录入房源的房源图片和房源特征信息,从而,避免将虚假房源发布至网络平台,提高了网络平台中展示的房源的准确度,提升了该网络平台的用户黏度。
S390、确定鉴别图集中不存在与新录入房源相似的参考标准图片,输出建议进行人为验证处理的提示信息。
本公开实施例的技术方案,基于目标对象对新录入房源进行分割处理得到至少两个子图片,分别将包含目标对象的子图片与鉴别图集中的参考标准图片中具有相同目标对像的子区域进行匹配,根据匹配结果确定新录入房源与参考标准图片的相似度,避免对整幅图片进行匹配的情况发生,可以有效地减少图像匹配的数据量,提高了图片匹配的效率。
可选的,在基于所述目标对象由鉴别图集中查询包含相同目标对象的参考标准图片之后,还包括:
在所述鉴别图集中不包括具有相同目标对象的参考标准图片时,输出建议进行人为验证处理的提示信息;
若检测到人为验证结果为新录入的房源是真实房源,则获取新录入的所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集。
具体的,如果在鉴别图集中不包括具有相同目标对象的参考标准图片时,则无法验证该房源是否为虚假房源,因此可以输出人为验证处理的提示信息,用于提示房产中介的管理人员校验该房源,以确定该房源是否为虚假房源。房产经纪人可以进行实地考察验证,如果检测到新录入的房源的验证结果为真实房源,则可以进一步获取所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集,更新该鉴别图集,以便提高后续房源虚假信息验证的效率和准确率。
图4为本公开实施例提供的一种识别虚假房源装置的结构示意图,如图4所示,所述装置包括:
信息获取模块410,用于获取新录入房源的房源图片和房源特征信息;
图片匹配模块420,用于将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;
房源鉴别模块430,用于在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。
本公开实施例的技术方案,通过将新录入房源的房源特征信息和与其图像匹配的真实房源的标准房源特征信息进行比对的方式,实现根据已有真实房源特征信息验证新获取的房源特征信息的真伪的效果,避免通过修改房源描述信息未修改房源照片得到的虚假房源被发布到网络平台的情况发生,有效地减少虚假房源被上传网络平台的概率,提高了网络平台中展示的房产信息的准确度,提升了该网络平台的用户黏度。
可选的,所述装置还包括:房源标识关联模块,用于所述房源鉴别模块在确定新录入的所述房源为真实房源之后,将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识。
可选的,所述鉴别图集是真实房源的标准房源图片的集合;
在构建所述鉴别图集时,将真实房源的房源特征信息与所述标准房源图片进行关联存储。
可选的,所述图片匹配模块420,包括:
标准图片查询单元,用于基于所述房源特征信息由鉴别图集中查询参考标准图片;
图片相似度计算单元,用于计算所述房源图片和所述参考标准图片的相似度;
目标标准图片确定单元,用于在所述相似度超过设定阈值时,确定所述参考标准图片是目标标准图片。
可选的,所述图片匹配模块420,还包括:
子图片划分单元,用于基于所述房源图片包含的目标对象将所述房源图片划分为至少两个子图片;
子区域匹配单元,用于分别将所述子图片与所述参考标准图片中具有相同目标对象的子区域进行匹配;
相似度确定单元,用于根据匹配结果为所述参考标准图片打分,根据得分确定所述房源图片和所述参考标准图片的相似度。
可选的,所述装置还包括:
提示信息提取模块,用于在所述图片匹配模块420基于所述目标对象由鉴别图集中查询包含相同目标对象的参考标准图片之后,在所述鉴别图集中不包括具有相同目标对象的参考标准图片时,输出建议进行人为验证处理的提示信息;
鉴别图集更新模块,用于若检测到人为验证结果为新录入的房源是真实房源,则获取新录入的所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集。
可选的,所述装置还包括:虚假房源确定模块,用于在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息。
本公开实施例所提供的识别虚假房源的装置,可执行本公开任意实施例所提供的识别虚假房源的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开任意实施例提供的识别虚假房源的方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备500的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取新录入房源的房源图片和房源特征信息;将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。
Claims (8)
1.一种识别虚假房源的方法,其特征在于,包括:
获取新录入房源的房源图片和房源特征信息,所述房源特征信息包括房源基本信息和房源标识,所述房源基本信息唯一标识一个房源记录,所述房源标识表明所述房源记录的来源;
将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;
在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源,将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识;
在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息;
所述鉴别图集是真实房源的标准房源图片的集合,所述真实房源是通过线下查验确认了真实性的房源。
2.根据权利要求1所述的方法,其特征在于,在构建所述鉴别图集时,将真实房源的房源特征信息与所述标准房源图片进行关联存储。
3.根据权利要求1所述的方法,其特征在于,将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片,包括:
基于所述房源特征信息由鉴别图集中查询参考标准图片;
计算所述房源图片和所述参考标准图片的相似度;
在所述相似度超过设定阈值时,确定所述参考标准图片是目标标准图片。
4.根据权利要求3所述的方法,其特征在于,计算所述房源图片和所述参考标准图片的相似度,包括:
基于所述房源图片包含的目标对象将所述房源图片划分为至少两个子图片;
分别将所述子图片与所述参考标准图片中具有相同目标对象的子区域进行匹配;
根据匹配结果为所述参考标准图片打分,根据得分确定所述房源图片和所述参考标准图片的相似度。
5.根据权利要求3所述的方法,其特征在于,在基于目标对象由鉴别图集中查询包含相同目标对象的参考标准图片之后,还包括:
在所述鉴别图集中不包括具有相同目标对象的参考标准图片时,输出建议进行人为验证处理的提示信息;
若检测到人为验证结果为新录入的房源是真实房源,则获取新录入的所述房源的房源特征信息,并在将所述房源图片与所述房源特征信息关联后,将所述房源图片存储于所述鉴别图集。
6.一种识别虚假房源的装置,其特征在于,包括:
信息获取模块,用于获取新录入房源的房源图片和房源特征信息,所述房源特征信息包括房源基本信息和房源标识,所述房源基本信息唯一标识一个房源记录,所述房源标识表明所述房源记录的来源;
图片匹配模块,用于将所述房源图片与鉴别图集中真实房源的标准房源图片进行相似度匹配,根据匹配结果确定目标标准图片;
房源鉴别模块,用于在所述房源特征信息与所述目标标准图片对应的标准房源特征信息相同时,确定新录入的所述房源为真实房源,将新录入的所述房源的房源标识关联到所述真实房源对应的线上房源标识;
虚假房源确定模块,用于在所述房源特征信息与所述标准房源特征信息不相同时,确定新录入的所述房源为虚假房源,删除新录入的所述房源的房源图片和房源特征信息;
所述鉴别图集是真实房源的标准房源图片的集合,所述真实房源是通过线下查验确认了真实性的房源。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的识别虚假房源的方法。
8.一种电子设备,其特征在于,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-5中任一所述的识别虚假房源的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811592900.4A CN110633381B (zh) | 2018-12-25 | 2018-12-25 | 一种识别虚假房源的方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811592900.4A CN110633381B (zh) | 2018-12-25 | 2018-12-25 | 一种识别虚假房源的方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110633381A CN110633381A (zh) | 2019-12-31 |
CN110633381B true CN110633381B (zh) | 2023-04-07 |
Family
ID=68968330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811592900.4A Active CN110633381B (zh) | 2018-12-25 | 2018-12-25 | 一种识别虚假房源的方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110633381B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111311358B (zh) * | 2020-01-20 | 2023-05-30 | 北京有竹居网络技术有限公司 | 信息处理方法、装置和电子设备 |
CN111260445A (zh) * | 2020-01-20 | 2020-06-09 | 北京无限光场科技有限公司 | 房源信息展示方法、装置、终端及存储介质 |
CN111275460B (zh) * | 2020-01-21 | 2023-11-03 | 重庆知翔科技有限公司 | 一种真假房源认证方法 |
CN111383032B (zh) * | 2020-02-12 | 2023-11-14 | 北京城市网邻信息技术有限公司 | 一种房源信息的真实性检测方法和装置 |
CN111552869B (zh) * | 2020-03-31 | 2022-04-22 | 北京城市网邻信息技术有限公司 | 一种房源信息显示方法和装置 |
CN111552868B (zh) * | 2020-03-31 | 2024-06-11 | 北京城市网邻信息技术有限公司 | 一种房源信息的排序方法和装置 |
CN111737599A (zh) * | 2020-05-07 | 2020-10-02 | 北京城市网邻信息技术有限公司 | 一种房源对象的验证方法和装置 |
CN113505137B (zh) * | 2021-07-27 | 2022-07-08 | 重庆市规划和自然资源信息中心 | 一种不动产空间图形更新方法 |
CN113706173B (zh) * | 2021-08-31 | 2022-07-08 | 北京五八信息技术有限公司 | 一种信息管理方法、装置、电子设备及存储介质 |
CN117689454A (zh) * | 2023-12-20 | 2024-03-12 | 天津异乡好居网络科技股份有限公司 | 房源素材更新方法、装置、设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463732A (zh) * | 2014-11-17 | 2015-03-25 | 中润博远(北京)科技有限公司 | 房源管理系统及其房源数据处理方法 |
CN106952190A (zh) * | 2017-03-22 | 2017-07-14 | 国信优易数据有限公司 | 虚假房源录入行为识别与预警系统 |
CN106971256A (zh) * | 2017-02-16 | 2017-07-21 | 安徽新安爱房资讯有限公司 | 一种房产信息智能化管理系统 |
CN107220911A (zh) * | 2017-05-10 | 2017-09-29 | 深圳市易图资讯股份有限公司 | 一种楼市和房源信息管理系统 |
CN107563860A (zh) * | 2017-09-01 | 2018-01-09 | 广州米拉信息科技有限公司 | 一种按分钟计费租赁住宿产品的方法 |
CN108304482A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 经纪人的识别方法及装置、电子设备和可读存储介质 |
CN108427714A (zh) * | 2018-02-02 | 2018-08-21 | 北京邮电大学 | 基于机器学习的房源重复记录识别方法及系统 |
CN108763570A (zh) * | 2018-06-05 | 2018-11-06 | 北京拓世寰宇网络技术有限公司 | 一种识别相同房源的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10380681B2 (en) * | 2015-09-08 | 2019-08-13 | Bank Of America Corporation | Real-time data processing |
US10169663B2 (en) * | 2016-09-01 | 2019-01-01 | The Boeing Company | Scene change detection via multiple sensors |
-
2018
- 2018-12-25 CN CN201811592900.4A patent/CN110633381B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463732A (zh) * | 2014-11-17 | 2015-03-25 | 中润博远(北京)科技有限公司 | 房源管理系统及其房源数据处理方法 |
CN106971256A (zh) * | 2017-02-16 | 2017-07-21 | 安徽新安爱房资讯有限公司 | 一种房产信息智能化管理系统 |
CN106952190A (zh) * | 2017-03-22 | 2017-07-14 | 国信优易数据有限公司 | 虚假房源录入行为识别与预警系统 |
CN107220911A (zh) * | 2017-05-10 | 2017-09-29 | 深圳市易图资讯股份有限公司 | 一种楼市和房源信息管理系统 |
CN107563860A (zh) * | 2017-09-01 | 2018-01-09 | 广州米拉信息科技有限公司 | 一种按分钟计费租赁住宿产品的方法 |
CN108304482A (zh) * | 2017-12-29 | 2018-07-20 | 北京城市网邻信息技术有限公司 | 经纪人的识别方法及装置、电子设备和可读存储介质 |
CN108427714A (zh) * | 2018-02-02 | 2018-08-21 | 北京邮电大学 | 基于机器学习的房源重复记录识别方法及系统 |
CN108763570A (zh) * | 2018-06-05 | 2018-11-06 | 北京拓世寰宇网络技术有限公司 | 一种识别相同房源的方法及装置 |
Non-Patent Citations (1)
Title |
---|
在线短租房源图片对消费者行为意愿的影响;吴江等;《数据分析与知识发现》;20171225;第10-20页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110633381A (zh) | 2019-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633381B (zh) | 一种识别虚假房源的方法、装置、存储介质及电子设备 | |
US11050551B2 (en) | Secure verification of conditions of a contract using a set of verification tools | |
CN110633726A (zh) | 一种房源识别方法、装置、存储介质及电子设备 | |
US8862589B2 (en) | System and method for predicting a geographic origin of content and accuracy of geotags related to content obtained from social media and other content providers | |
CN110335139B (zh) | 基于相似度的评估方法、装置、设备及可读存储介质 | |
KR20180074316A (ko) | 장소 정보를 제공하기 위한 시스템 및 이를 지원하는 방법 및 전자 장치 | |
CN110619039A (zh) | 一种房产信息的校验方法、装置、存储介质及电子设备 | |
CN110618982B (zh) | 一种多源异构数据的处理方法、装置、介质及电子设备 | |
CN109387215B (zh) | 路线推荐方法和装置 | |
CN110781263A (zh) | 房源信息展示方法、装置、电子设备及计算机存储介质 | |
CN109510874A (zh) | 基于lbs的电子凭证推送方法、装置及电子设备 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN107480173B (zh) | Poi信息的展示方法及装置、设备及可读介质 | |
CN110930220A (zh) | 一种显示方法、装置、终端设备及介质 | |
CN113011856B (zh) | 能源企业线上入驻方法、装置、电子设备和介质 | |
CN111597466A (zh) | 展示方法、装置和电子设备 | |
CN112417318A (zh) | 一种兴趣点的状态确定方法、装置、电子设备及介质 | |
CN110737820B (zh) | 用于生成事件信息的方法和装置 | |
CN110287350A (zh) | 图像检索方法、装置及电子设备 | |
CN111400476A (zh) | 房源识别方法、装置、可读介质及电子设备 | |
CN111798192A (zh) | 网络招聘方法和系统 | |
CN112966752B (zh) | 图像匹配方法和装置 | |
CN110458099B (zh) | 用于输出信息的方法和装置 | |
CN111241368B (zh) | 数据处理方法、装置、介质和设备 | |
CN111125272B (zh) | 一种区域特征获取方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230421 Address after: Room 802, Information Building, 13 Linyin North Street, Pinggu District, Beijing, 101299 Patentee after: Beijing youzhuju Network Technology Co.,Ltd. Address before: 100086 no.179, 15th floor, block B, building 1, No.38, Zhongguancun Street, Haidian District, Beijing Patentee before: BEIJING SHIGUANG RENRAN TECHNOLOGY Co.,Ltd. |