CN112232131B - 基于计算机视觉的户型特征指标自动提取方法及系统 - Google Patents

基于计算机视觉的户型特征指标自动提取方法及系统 Download PDF

Info

Publication number
CN112232131B
CN112232131B CN202010984201.5A CN202010984201A CN112232131B CN 112232131 B CN112232131 B CN 112232131B CN 202010984201 A CN202010984201 A CN 202010984201A CN 112232131 B CN112232131 B CN 112232131B
Authority
CN
China
Prior art keywords
user
screening
house type
house
select
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010984201.5A
Other languages
English (en)
Other versions
CN112232131A (zh
Inventor
陈果
刘鹏山
冷天
杨建兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Design Institute Group Co ltd
Original Assignee
Yunnan Design Institute Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Design Institute Group Co ltd filed Critical Yunnan Design Institute Group Co ltd
Priority to CN202010984201.5A priority Critical patent/CN112232131B/zh
Publication of CN112232131A publication Critical patent/CN112232131A/zh
Application granted granted Critical
Publication of CN112232131B publication Critical patent/CN112232131B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于计算机视觉的户型特征指标自动提取方法及系统,属于住宅设计技术领域。该系统包括采集单元,用于采集住宅户型图片和/或设计文件;图库构建单元,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;筛选单元,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;检索单元,用于将筛选结果反馈给用户,以供用户浏览或下载。通过本发明,设计人员能够在成千上万种户型图中,快速搜索到符合自己要求的户型,成本低,效率高,易于推广应用。

Description

基于计算机视觉的户型特征指标自动提取方法及系统
技术领域
本发明属于住宅设计技术领域,具体涉及一种基于计算机视觉的户型特征指标自动提取方法及应用于住宅设计行业的户型搜索系统。
背景技术
在勘察设计行业中,设计人员在进行住宅户型设计时,经常会参考现有市场中的项目户型图。其来源主要有三种,一种是设计公司内部多年积累的户型图库,一种是由第三方公司提供的户型图库,还有一种是互联网中各个楼盘的图片。前两者一般是经过整理的CAD图,提供建筑面积、居室数量等筛选条件;而互联网中的户型图片则主要是面对购房者的,不提供针对设计人员的筛选选项。目前并没有成熟的针对应用于住宅设计行业的户型搜索系统。
发明内容
本发明的目的是为了解决现有技术的不足,提供一种基于计算机视觉的户型特征指标自动提取方法及应用于住宅设计行业的户型搜索系统,以便于住宅设计人员能够在成千上万种户型图中,最快搜索到符合自己要求的户型。
为实现上述目的,本发明采用的技术方案如下:
基于计算机视觉的户型特征指标自动提取方法,包括如下步骤:
步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;
步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、卫数量特征指标,无厨房描述时,默认厨数量为1;
步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数不变;如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面宽的特征指标;
步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;
步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;
测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:
Figure BDA0002688660930000021
其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;
然后,计算出各边采光面系数,用公示表示如下:
Figure BDA0002688660930000022
其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;
采光面的特征指标R为四边采光面系数之和;
步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗中的至少一种。
至此,户型特征指标自动提取完毕。
进一步,优选的是,通过定位建筑面积、建面、平方米、m2字符匹配得到建筑面积的特征指标;通过定位套内面积、使用面积、平方米、m2字符匹配得到套内面积的特征指标;通过定位x室x厅x卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量的特征指标。
进一步,优选的是,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。
本发明同时提供一种应用于住宅设计行业的户型搜索系统,包括采集单元、图库构建单元、筛选单元和检索单元;
采集单元,用于采集住宅户型图片和/或设计文件;
图库构建单元,与采集单元相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;
筛选单元,与图库构建单元相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;
检索单元,与筛选单元相连,用于将筛选结果反馈给用户,以供用户浏览或下载。
进一步,优选的是,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。
进一步,优选的是,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户型特点、户型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向户型图的一到几项特征指标,用于描述其独特属性。
进一步,优选的是,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;通过计算机视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型特点。
进一步,优选的是,所述的应用于住宅设计行业的户型搜索系统,是采用上述基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标。
进一步,优选的是,所述筛选单元以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;
所述检索单元还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用。
进一步,优选的是,所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;
所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,R=7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;
所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;
所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1-5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。
本发明优选,依据ZL201810023786.7《户型特征的自动提取方法、系统、电子设备和存储介质》来提取户型的户型特点特征指标。
本发明所述的图片库是户型图载体,为JPG、PNG等位图格式文件或CAD、BIM等矢量格式文件。
本发明采集的住宅户型图片和/或设计文件来源于公开信息、公司内部整理信息、购买自其他公司信息以及其他经合法方式取得的信息,需要去除其中完全重复的内容,去除其中完全重复的内容的方式本发明不做限制,可以采用经电子计算机编程或人工复核方式甄别去除。采集单元可以为实时采集,实时更新图库内容,也可以是定期采集,定期更新图库内容。
本发明中,所述搜索关键字是以住宅设计角度建立的、可从各个维度描述住宅户型特征的关键字。
本发明中,优选开发商名称筛选时,提供全国前十强开发商,本省前十强开发商等特定选择集。
本发明中,多层住宅建筑(建筑高度小于等于27m);小高层住宅建筑(建筑高度大于27m且小于等于33m);二类高层住宅建筑(建筑高度大于33m且小于等于54m);一类高层住宅建筑(建筑高度大于54m且小于等于100m);超高层住宅建筑(建筑高度大于100m)的防火设计是依据《建筑设计防火规范》GB 50016-2014(2018年版)和《住宅设计规范》GB 50096-2011相关内容,并随规范更新而调整。
本发明与现有技术相比,其有益效果为:
本发明通过将户型图库中的内容与筛选单元相关联,通过其总共23个维度的关键字,囊括了户型设计中几乎所有的指标,使设计人员能在最短的时间内获取到自己需要的户型图。同时,此系统也可由开发商或第三方信息中介提供给购房者,使后者能更有针对性地得到自己心仪楼盘户型的信息并作出选择。
住宅户型设计千变万化,即使是同样面积的户型,由于设计条件或理念不同(如面宽受限,层数不同,或需要追求尽可能多的房间数等等),也会有成百上千种实现方式。但目前市场种现有的户型参考库,大多只提供一到数种分类方法(如建筑面积、厅室数量)进行筛选。以平均每次筛选留下上次结果的20%样本,筛选3次计算,最终结果为总样本数的0.8%,如有100万个样本,仍然剩下8000个需要人工浏览确认,难以有效地剔除无关户型;而使用本发明中的方法,即使只使用23个关键字中的10个,同样是100万个样本,理论上最终只剩下0.1024个样本(即表示筛选维度仍然过剩),即使户型设计日新月异,也能在将来很长一段时间内满足筛选需求。本发明可有效改变现在样本少时不堪使用,样本多时又挑花了眼的鸡肋局面,使采用户型库进行参考设计能成为一种有力的选择。
附图说明
图1是本发明应用于住宅设计行业的户型搜索系统的结构示意图;
图2是使用本发明应用于住宅设计行业的户型搜索系统的流程图;
图3为本发明应用实例中OCR处理图片;
图4是本发明应用实例中采光面特征指标的计算示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用材料或设备未注明生产厂商者,均为可以通过购买获得的常规产品。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”到另一元件时,它可以直接连接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”可以包括无线连接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“内”、“上”、“下”等指示的方位或状态关系为基于附图所示的方位或状态关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”、“设有”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,根据具体情况理解上述术语在本发明中的具体含义。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
基于计算机视觉的户型特征指标自动提取方法,包括如下步骤:
步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;
步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、卫数量特征指标,无厨房描述时,默认厨数量为1;
步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数不变;如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面宽的特征指标;
步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;
步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;
测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:
Figure BDA0002688660930000081
其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;
然后,计算出各边采光面系数,用公示表示如下:
Figure BDA0002688660930000082
其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;
采光面的特征指标R为四边采光面系数之和;
步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗。至此,户型特征指标自动提取完毕。
其中,优选,通过定位建筑面积、建面、平方米、m2字符匹配得到建筑面积的特征指标;通过定位套内面积、使用面积、平方米、m2字符匹配得到套内面积的特征指标;通过定位x室x厅x卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量的特征指标。
优选,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。
一种应用于住宅设计行业的户型搜索系统,包括采集单元101、图库构建单元102、筛选单元103和检索单元104;
采集单元101,用于采集住宅户型图片和/或设计文件;
图库构建单元102,与采集单元101相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;
筛选单元103,与图库构建单元102相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;
检索单元104,与筛选单元103相连,用于将筛选结果反馈给用户,以供用户浏览或下载。
优选,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。
优选,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户型特点、户型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向户型图的一到几项特征指标,用于描述其独特属性。
优选,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;通过计算机视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型特点。
优选,所述的应用于住宅设计行业的户型搜索系统,是采用上述基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标。
优选,所述筛选单元103以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;
所述检索单元104还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用;更为优选,用户评分为0~5,满意度越高分值越大,默认为0分。
优选,所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;
所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,R=7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;
所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;
所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1-5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
应用实例
某用户希望搜索54米高度,2梯3户,3室2厅1厨1卫,建筑面积为105平方米的中户型,在终端设备输入如下:建筑面积:100-110平方米,防火设计分类:二类高层住宅建筑,电梯数量:2部,楼梯数量:1部,每层户数:3户,厅数量:2,室数量:3,厨数量:1,卫数量:1,采光面:1长边,户型分类:高层住宅,户型层数:平层,开发商:全国前十强开发商,用户评分:4分及以上。筛选单元根据用户输入信息,筛选后将筛选结果提交检索单元。用户可在此结果基础上更改或补充条件,如输入:建筑面积:103-108平方米,城市:北京,以进一步得到更符合需求的筛选结果。
所述检索单元,用于将上一步得到的筛选结果反馈给用户,以供用户浏览或下载。
本实例中,所述检索单元得到了所有符合要求的结果,用户可逐一浏览,或选择其中部分或全部文件下载,并可对其进行评分及评论。
本发明中户型特征指标自动提取过程如下:
步骤(1),对图3进行OCR处理,得到其所包含文本和文本位置的列表如下:
序号内容
1 12200
宽度:35高度:16
左间距:298上间距:9
2 1300
宽度:47高度:21
左间距:70上间距:32
3 3000
宽度:27高度:14
左间距:161上间距:34
4 2400
宽度:29高度:14
左间距:275上间距:34
5 2800
宽度:28高度:14
左间距:386上间距:34
6 2700
宽度:27高度:14
左间距:503上间距:34
7阳台
宽度:38高度:26
左间距:216上间距:114
8卧室
宽度:38高度:26
左间距:158上间距:201
9厨房
宽度:38高度:25
左间距:268上间距:198
10卧室
宽度:39高度:25
左间距:408上间距:215
11卫
宽度:17高度:24
左间距:513上间距:320
12餐厅
宽度:39高度:25
左间距:306上间距:381
13卫
宽度:17高度:24
左间距:513上间距:396
14卫
宽度:18高度:24
左间距:94上间距:492
15主卧
宽度:37高度:24
左间距:466上间距:521
16起居室
宽度:58高度:26
左间距:275上间距:566
17卧室
宽度:39高度:27
左间距:118上间距:600
18阳台
宽度:38高度:25
左间距:240上间距:696
19 8
宽度:14高度:27
左间距:650上间距:702
20 3300
宽度:29高度:17
左间距:113上间距:802
21 5100
宽度:29高度:16
左间距:291上间距:802
22 3800
宽度:28高度:16
左间距:480上间距:803
23 12200
宽度:35高度:16
左间距:299上间距:833
24 4室2厅1厨3卫建筑面积约148平方米
宽度:356高度:27
左间距:135上间距:871
步骤(2),通过字符匹配得到建筑面积特征指标为“148”,得到厅数量、室数量、厨数量、卫数量特征指标分别为“4,2,1,3”;
步骤(3),提取所有数值,并计算后可得面宽特征指标为“12200”;
步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),提取所有数值,并计算后可得面宽特征指标为“15500”;
步骤(5),采光面特征指标的计算示例如图3所示,具体计算方法如下:
外接矩形两个长边Qy的窗墙比分别为:Sy1=0;
Sy2=(Cy1+Cy2+Cy3+Cy4+Cy5)/Qy;
外接矩形两个短边Qx的窗墙比分别为:
Sx1=(Cx3+Cx4+Cx5)/Qx;
Sx2=(Cx1+Cx2)/Qx;
四个边的r值分别为0,3,1,1,
R=0+3+1+1=5,特征指标为2短边+1长边。
步骤(6)根据发明专利ZL201810023786.7《户型特征的自动提取方法、系统、电子设备和存储介质》,提供一种户型特征的自动提取方法、系统、电子设备和存储介质,自动提取方法包括:读取目标户型图像的矢量信息;将所述目标户型图像的矢量信息输入预设的户型特征提取模型中,得到对应所述目标户型图像的特征标签,其中,所述户型特征提取模型中存储有各矢量信息与特征标签之间的一一对应关系;根据预设的评分规则,对所述目标户型图像的各个特征标签进行打分,并统计所述目标户型图像的全部特征标签的分数,得到所述目标户型图像的总评分;以及,输出所述目标户型图像的特征标签及总评分。本发明能够高效、准确且自动地提取户型的各种特征,进而能够有效降低人力和时间成本。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (9)

1.基于计算机视觉的户型特征指标自动提取方法,其特征在于,包括如下步骤:
步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;
步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、卫数量特征指标,无厨房描述时,默认厨数量为1;
步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数不变;如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面宽的特征指标;
步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;
步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;
测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:
Figure FDA0003258524490000011
其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;
然后,计算出各边采光面系数,用公示表示如下:
Figure FDA0003258524490000021
其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;
采光面的特征指标R为四边采光面系数之和;
步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、II形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗。
2.根据权利要求1所述的基于计算机视觉的户型特征指标自动提取方法,其特征在于,通过定位建筑面积、建面、平方米、m2字符匹配得到建筑面积的特征指标;通过定位套内面积、使用面积、平方米、m2字符匹配得到套内面积的特征指标;通过定位×室×厅×卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量的特征指标。
3.根据权利要求1所述的基于计算机视觉的户型特征指标自动提取方法,其特征在于,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。
4.一种应用于住宅设计行业的户型搜索系统,其特征在于,采用权利要求1-3任意一项所述的基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标;包括采集单元、图库构建单元、筛选单元和检索单元;
采集单元,用于采集住宅户型图片和/或设计文件;
图库构建单元,与采集单元相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;
筛选单元,与图库构建单元相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;
检索单元,与筛选单元相连,用于将筛选结果反馈给用户,以供用户浏览或下载。
5.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。
6.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户型特点、户型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向户型图的一到几项特征指标,用于描述其独特属性。
7.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;通过计算机视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型特点。
8.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于:所述筛选单元以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;
所述检索单元还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用。
9.根据权利要求6所述的应用于住宅设计行业的户型搜索系统,其特征在于:
所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;
所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,R=7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;
所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;
所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1-5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。
CN202010984201.5A 2020-09-18 2020-09-18 基于计算机视觉的户型特征指标自动提取方法及系统 Active CN112232131B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010984201.5A CN112232131B (zh) 2020-09-18 2020-09-18 基于计算机视觉的户型特征指标自动提取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010984201.5A CN112232131B (zh) 2020-09-18 2020-09-18 基于计算机视觉的户型特征指标自动提取方法及系统

Publications (2)

Publication Number Publication Date
CN112232131A CN112232131A (zh) 2021-01-15
CN112232131B true CN112232131B (zh) 2021-12-24

Family

ID=74107269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010984201.5A Active CN112232131B (zh) 2020-09-18 2020-09-18 基于计算机视觉的户型特征指标自动提取方法及系统

Country Status (1)

Country Link
CN (1) CN112232131B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114494714B (zh) * 2021-12-17 2024-05-14 上海品览数据科技有限公司 一种对建筑专业总平面图楼栋轮廓的精准识别方法
CN114444987B (zh) * 2022-04-11 2022-06-28 深圳小库科技有限公司 一种户型图的自动化分析方法及装置
CN116206325A (zh) * 2023-02-14 2023-06-02 南京艾小宝智能科技有限公司 一种户型图的识别系统及其方法
CN116933380A (zh) * 2023-09-12 2023-10-24 北京装库创意科技有限公司 基于深度学习的户型图拆解分析方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304848A (zh) * 2018-01-10 2018-07-20 链家网(北京)科技有限公司 户型特征的自动提取方法、系统、电子设备和存储介质
CN108427714A (zh) * 2018-02-02 2018-08-21 北京邮电大学 基于机器学习的房源重复记录识别方法及系统
CN108717726A (zh) * 2018-05-11 2018-10-30 北京家印互动科技有限公司 三维户型模型生成方法及装置
CN108763606A (zh) * 2018-03-12 2018-11-06 江苏艾佳家居用品有限公司 一种基于机器视觉的户型图元素自动提取方法与系统
CN108984765A (zh) * 2018-07-20 2018-12-11 我要家网络科技有限公司 一种基于智能图像分析的户型图找房方法
CN109840376A (zh) * 2019-01-28 2019-06-04 司空科技股份有限公司 户型图的读取方法,装置以及存储介质
CN110781539A (zh) * 2019-09-29 2020-02-11 江苏艾佳家居用品有限公司 一种户型图自动设计方法及系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600301A (zh) * 2015-10-20 2017-04-26 张志恒 为购房者生成个性化楼盘列表的推荐系统算法
SG10201705098QA (en) * 2017-06-20 2018-09-27 Attribuild Pte Ltd Residential real estate layout data collection, search, rating and ranking system and method
CN109242764A (zh) * 2018-08-29 2019-01-18 北京道亨时代科技有限公司 一种二维cad平面图自动转换Revit三维模型的方法
CN109508423A (zh) * 2018-12-14 2019-03-22 平安科技(深圳)有限公司 基于语义识别的房源推荐方法、装置、设备及存储介质
CN111340580B (zh) * 2020-02-05 2021-05-25 深圳市道旅旅游科技股份有限公司 房型的确定方法、装置、计算机设备和存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108304848A (zh) * 2018-01-10 2018-07-20 链家网(北京)科技有限公司 户型特征的自动提取方法、系统、电子设备和存储介质
CN108427714A (zh) * 2018-02-02 2018-08-21 北京邮电大学 基于机器学习的房源重复记录识别方法及系统
CN108763606A (zh) * 2018-03-12 2018-11-06 江苏艾佳家居用品有限公司 一种基于机器视觉的户型图元素自动提取方法与系统
CN108717726A (zh) * 2018-05-11 2018-10-30 北京家印互动科技有限公司 三维户型模型生成方法及装置
CN108984765A (zh) * 2018-07-20 2018-12-11 我要家网络科技有限公司 一种基于智能图像分析的户型图找房方法
CN109840376A (zh) * 2019-01-28 2019-06-04 司空科技股份有限公司 户型图的读取方法,装置以及存储介质
CN110781539A (zh) * 2019-09-29 2020-02-11 江苏艾佳家居用品有限公司 一种户型图自动设计方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于CNN的住宅平面图元素识别与布局语义分析;张蔚 等;《中国体视学与图像分析》;20200827;第174-181页 *

Also Published As

Publication number Publication date
CN112232131A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN112232131B (zh) 基于计算机视觉的户型特征指标自动提取方法及系统
US11532057B1 (en) Automatic updating of real estate database
US8433706B2 (en) Preference stack
CN107004297A (zh) 基于二维平面图的三维自动立体建模方法及程序
CN106204118A (zh) 一种用于商圈发现的方法与装置
Vika et al. MegaMorph: classifying galaxy morphology using multi-wavelength Sérsic profile fits
CN108389624A (zh) 基于cox比例风险模型的十二指肠腺癌预后预测系统
CN107506499A (zh) 兴趣点与建筑物之间建立逻辑关系的方法、装置及服务器
CN104462553A (zh) 问答页面相关问题推荐方法及装置
CN111026937A (zh) 提取poi名称的方法、装置、设备和计算机存储介质
CN103488787B (zh) 一种基于视频搜索的在线播放入口对象的推送方法和装置
CN111353851A (zh) 酒店排序推荐方法、装置、电子设备、存储介质
US6298350B1 (en) Method for automatic processing of information materials for customised use
WO2022252822A1 (zh) 信息展示方法、装置、设备及介质
CN110134794B (zh) 一种实体画像的构建方法和装置
CN104462552B (zh) 问答页面核心词提取方法和装置
Li et al. Estimation of average daylight factor under obstructed CIE Standard General Skies
KR20200014589A (ko) 지역 기반 아이템 추천 장치 및 방법
Wahyudi et al. Topic modeling of online media news titles during COVID-19 emergency response in Indonesia using the latent dirichlet allocation (LDA) algorithm
CN112380338A (zh) 一种基于历史知识库的言历图谱的可视化方法和系统
WO2016007162A1 (en) Categorizing columns in a data table
Böhringer et al. The Cosmic Large-Scale Structure in X-rays (CLASSIX) Cluster Survey-IV. Superclusters in the local Universe at z≤ 0.03
JP4518388B2 (ja) ウェブページ閲覧装置
Ahmad et al. Computer vision based room interior design
CN103500214B (zh) 一种基于视频搜索的分词信息推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant