CN116188125B - 一种写字楼的招商管理方法、装置、电子设备及存储介质 - Google Patents

一种写字楼的招商管理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116188125B
CN116188125B CN202310262709.8A CN202310262709A CN116188125B CN 116188125 B CN116188125 B CN 116188125B CN 202310262709 A CN202310262709 A CN 202310262709A CN 116188125 B CN116188125 B CN 116188125B
Authority
CN
China
Prior art keywords
text
paragraph
bid
sentence
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310262709.8A
Other languages
English (en)
Other versions
CN116188125A (zh
Inventor
阳晟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Partner Line Network Technology Co ltd
Original Assignee
Shenzhen Partner Line Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Partner Line Network Technology Co ltd filed Critical Shenzhen Partner Line Network Technology Co ltd
Priority to CN202310262709.8A priority Critical patent/CN116188125B/zh
Publication of CN116188125A publication Critical patent/CN116188125A/zh
Application granted granted Critical
Publication of CN116188125B publication Critical patent/CN116188125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种写字楼的招商管理方法、装置、电子设备及存储介质,本发明充分利用了机器智能化处理手段来实现写字楼中各个盘源的招商要求,与用户需求之间的识别以及匹配,如此,能够根据匹配度来为各个盘源提供多个适用客户,从而快速匹配出各个盘源的推荐招商引资用户,实现写字楼中各盘源的智能化招商管理,由此,不仅节约了大量的人力成本,还提高了推荐的准确性以及效率,适用于在各楼盘产业的招商引资领域的大规模应用与发展。

Description

一种写字楼的招商管理方法、装置、电子设备及存储介质
技术领域
本发明属于智能招商技术领域,具体涉及一种写字楼的招商管理方法、装置、电子设备及存储介质。
背景技术
项目招商,是指商业项目招商,是偏重于一种盈利式的经济行为,是达成项目终极目标的手段之一,它的本质是为了项目引进资金,招揽商户;项目招商被广泛应用于写字楼、产业园区、商业楼等产业,已成为各种楼盘产业发展经济的重要方式之一。
目前,在写字楼的招商引资领域,依然主要是依赖于工作人员对相关政策的解读,并将解读之后的政策与企业的公开信息进行人工匹配以及筛选,此种方法缺乏高效的智能化手段,不仅效率低下,还浪费了大量的人力成本;而随着计算机技术以及智能信息化的发展,很多领域开始利用机器智能化处理来替代繁琐的人工处理过程,不仅能够节省人力资源、降低成本,而且能够提高工作的准确率和稳定性;基于此,如何利用计算机技术,来实现写字楼等楼盘产业的智能化招商,已成为一个亟待解决的问题。
发明内容
本发明的目的是提供一种写字楼的招商管理方法、装置、电子设备及存储介质,用以解决现有技术中采用人工招商所存在的效率低下,以及浪费了大量人力成本的问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供了一种写字楼的招商管理方法,包括:
获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息;
对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合;
计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度;
按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数。
基于上述公开的内容,本发明先获取目标盘源的招商项目信息以及存在入驻意向的用户的招商投标信息,如此,即可获取用户的入驻需求、基本信息以及目标盘源对用户的招商要求;而后,本发明再对招商项目信息和各个招商投标信息进行分段处理,得到各自的文本段落集合;接着,通过计算招商投标信息对应文本段落集合,与各个招商投标信息的文本段落集合之间的相似度,来确定出该目标盘源与各个招商投标信息之间的匹配度;基于此,该步骤相当于将目标盘源的招商要求,与用户的入驻需求和基本信息进行一一匹配,得到各个用户与目标盘源之间的匹配度;最后,根据匹配度即可完成该目标盘源的招商引资推荐,从而实现该目标盘源的智能化招商管理。
通过上述设计,本发明充分利用了机器智能化处理手段来实现写字楼中各个盘源的招商要求,与用户需求之间的识别以及匹配,如此,能够根据匹配度来为各个盘源提供多个适用客户,从而快速匹配出各个盘源的推荐招商引资用户,实现写字楼中各盘源的智能化招商管理,由此,不仅节约了大量的人力成本,还提高了推荐的准确性以及效率,适用于在各楼盘产业的招商引资领域的大规模应用与发展。
在一个可能的设计中,计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,包括:
对于所述第一文本段落集合中的第i个第一文本段落,计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度;
将i自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至i等于n时,得到所述第一文本段落集合与第j个第二文本段落集合之间的段落相似度,其中,i的初始值为1,且n为第一文本段落的总数量;
将j自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至j等于x时,得到所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,其中,j的初始值为1,且x为第二文本段落集合的总数量。
在一个可能的设计中,计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,包括:
对于所述第i个第一文本段落和所述第j个第二文本段落集合中的任一第二文本段落,对所述第i个第一文本段落和所述任一第二文本段落进行分句处理,得到所述第i个第一文本段落的招商项目语句集合,以及所述任一第二文本段落的投标语句集合;
对于所述招商项目语句集合中的第h条招商项目语句,计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度;
利用所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,组成所述第h条招商项目语句的相似度向量;
将h自加1,并重新计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,直至h等于H时,得到每条招商项目语句的相似度向量,其中,h的初始值为1,且H为招商项目语句的总条数;
基于每条招商项目语句的相似度向量,构建所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度矩阵,并依据所述段落相似度矩阵,得出所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度。
在一个可能的设计中,计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,包括:
对于所述投标语句集合中任一投标语句,对所述第h条招商项目语句和所述任一投标语句进行分词处理,得到招商项目关键词集和投标关键词集;
判断所述招商项目关键词集中的词语个数是否小于所述投标关键词集中的词语个数;
若是,则对所述招商项目关键词集进行词语填充处理,得到填充招商项目关键词集;
计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度;
将g自加1,并重新计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,直至g等于G时,得到G个词语相似度,其中,g的初始值为1,且G为招商项目关键词的总个数;
利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度。
在一个可能的设计中,计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,包括:
分别将所述第g个招商项目关键词和所述第g个投标关键词转换为one-hot编码,以得到所述第g个招商项目关键词的编码向量以及所述第g个投标关键词的编码向量;
计算所述第g个招商项目关键词的编码向量与所述第g个投标关键词的编码向量之间的余弦距离,得到所述第g个招商项目关键词与所述第g个投标关键词之间的词语相似度。
在一个可能的设计中,利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度,包括:
将G个词语相似度中大于或等于词语相似度阈值的词语相似度置0,以及将小于词语相似度阈值的词语相似度置1,得到更新后的词语相似度;
计算更新后的词语相似度中目标词语相似度的占比,并判断所述目标词语相似度的占比是否大于或等于语句相似度阈值,其中,所述目标词语相似度为更新后的词语相似度中值为0的词语相似度;
若是,则将第h条招商项目语句和所述任一投标语句之间的相似度置为0,否则,则将第h条招商项目语句和所述任一投标语句之间的相似度置为1。
在一个可能的设计中,所述第一文本段落集合与任一第二文本段落集合之间的段落相似度包括:所述第一文本段落集合中的各个第一文本段落,与所述任一第二文本段落集合中的每个第二文本段落之间的段落相似度;
其中,利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度,包括:
对于任一第二文本段落集合,利用所述第一文本段落集合中的各个第一文本段落,与所述任一第二文本段落集合中的每个第二文本段落之间的段落相似度,并按照如下公式(1),构造出所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商匹配度矩阵;
上述式(1)中,S12表示所述招商匹配度矩阵,u1ny21表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第一个第二文本段落之间的段落相似度,u1ny2v表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第v个第二文本段落之间的段落相似度,n表示第一文本段落的总数量,v表示任一第二文本段落中的第二文本段落的总数量;
基于所述招商匹配度矩阵,计算得到所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商项目匹配度。
第二方面,提供了一种写字楼的招商管理装置,包括:
信息获取单元,用于获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息;
信息处理单元,用于对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合;
招商匹配单元,用于计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度;
招商匹配单元,用于按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数。
第三方面,提供了另一种写字楼的招商管理装置,以装置为电子设备为例,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意一种可能设计的所述写字楼的招商管理方法。
第四方面,提供了一种存储介质,存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意一种可能设计的所述写字楼的招商管理方法。
第五方面,提供了一种包含指令的计算机程序产品,当指令在计算机上运行时,使计算机执行如第一方面或第一方面中任意一种可能设计的所述写字楼的招商管理方法。
有益效果:
(1)本发明充分利用了机器智能化处理手段来实现写字楼中各个盘源的招商要求,与用户的需求之间的识别以及匹配,如此,能够快速匹配出各个盘源的推荐招商引资用户,从而实现写字楼中各盘源的智能化招商管理,不仅节约了大量的人力成本,还提高了推荐的准确性以及效率,适用于在各楼盘产业的招商引资领域的大规模应用与发展。
附图说明
图1为本发明实施例提供的写字楼的招商管理方法的步骤流程示意图;
图2为本发明实施例提供的写字楼的招商管理装置的结构示意图;
图3为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图和实施例或现有技术的描述对本发明作简单地介绍,显而易见地,下面关于附图结构的描述仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。
应当理解,尽管本文可能使用术语第一、第二等等来描述各种单元,但是这些单元不应当受到这些术语的限制。这些术语仅用于区分一个单元和另一个单元。例如可以将第一单元称作第二单元,并且类似地可以将第二单元称作第一单元,同时不脱离本发明的示例实施例的范围。
应当理解,对于本文中可能出现的术语“和/或”,其仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,单独存在B,同时存在A和B三种情况;对于本文中可能出现的术语“/和”,其是描述另一种关联对象关系,表示可以存在两种关系,例如,A/和B,可以表示:单独存在A,单独存在A和B两种情况;另外,对于本文中可能出现的字符“/”,一般表示前后关联对象是一种“或”关系。
实施例:
参见图1所示,本实施例所提供的写字楼的招商管理方法,先采集各目标盘源的招商项目信息,以及各个用户的招商投标信息;而后,再利用机器智能化处理手段来计算出招商项目信息与各个招商投标信息之间的匹配度,如此,相当于实现了用户需求、基本信息与盘源招商要求之间的匹配识别;最后,根据匹配度即可为目标盘源提供多个招商引资用户;通过上述设计,本方法可实现各个盘源的智能化招商引资,不仅效率高,还降低了人力成本;在本实施例中,举例该方法可以但不限于在招商管理端侧运行,其中,该招商管理端可以但不限于为个人电脑(personal computer,PC)、平板电脑或智能手机,可以理解的是,前述执行主体并不构成对本申请实施例的限定,相应的,本方法的运行步骤可以但不限于如下述步骤S1~S4所示。
S1.获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息;在本实施例中,举例目标盘源的招商项目信息和各个投标用户的招商投标信息可以但不限于在写字楼的招商平台上爬取得到;如给定写字楼的招商平台的网址,然后按照预设间隔时长进行数据的爬取,从而得到目标盘源的招商项目信息以及各个投标用户的招商投标信息;可选的,举例招商项目信息可以但不限于包括有招商主题(如餐饮行业、互联网行业、电影行业、服装行业等等)、招商企业要求(如最短租赁期限、费用支付要求等等)和盘源信息(如xx街xx号xx层xx号,面积2xx平方米、装修情况、物业情况说明、屋内设施情况说明、租赁费用说明等等);更进一步的,举例任一投标用户的用户信息则包括该任一投标用户的情况说明(若为个人,则是个人资产说明,租赁用户说明,若为企业,则是企业简介等),而入驻需求信息则是该任一用户对盘源的要求(如楼层、屋内设施要求、租赁年限要求、租赁费用要求等等);当然,前述举例仅是示意,前述信息可根据实际使用而具体调整内部内容,在此不作具体限定。
在得到目标盘源的招商项目信息和各个投标用户的招商投标信息后,即可进行目标盘源与投标用户的匹配,其中,本方法是利用前述信息之间的相似度,来确定出目标盘源与投标用户之间的匹配程度;具体的,匹配过程如下述步骤S2~S4所示。
在本实施例中,是利用信息的组成形式,来完成信息之间的相似度计算,即一个信息的基本组成是文本段落,其中,一个文本段落是由若干语句组成,而一个语句则是由若干词语来组成;基于此,本发明将招商项目信息与各个招商投标信息之间的相似度,简化为段落之间的相似度;如此,则需要先将招商项目信息和招商投标信息进行分段处理,以便后续进行段落相似度的计算;具体的,分段处理过程如下述步骤S2所示。
S2.对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合;在具体实施时,举例可以但不限采用文本分段模型(如训练后的线性分类器)来对招商项目信息和各个招商投标信息进行文本分段处理。
具体的,举例前述线性分类器的训练过程为:(1)获取训练数据集,其中,训练数据集包括多个文本数据;(2)获取每个文本数据的分句数据,得到每个文本数据对应的训练单句集;(3)将训练单句集输入至特征编码器,以得到每个文本数据对应的单句特征集;(4)获取训练单句集中每条训练单句的段落特征,其中,任一条训练单句的段落特征为该任一条训练单句所处的段落位置Z/N,且Z为该任一条训练单句在其对应段落中的句数排序(如处于第3句),N为任一条训练单句对应段落的总句数;(5)将每个文本数据的单句特征集,以及每个文本数据的训练单句的段落特征输入至BERT(Bidirectional EncoderRepresentations from Transformers,来自变换器的双向编码器表征量)模型中进行特征提取,得到每个文本数据的训练特征集;(6)以各个文本数据的训练特征集为输入,各个文本数据的分段数据为输出,训练线性分类器,以在训练完完毕后,得到文本分段模型。
在本实施例中,举例文本分段模型实质是识别出输入的文本信息中各句属于段落边界句的概率,如,大于或等于0.6则作为段落边界句,反之则不作为段落边界句;如此,即可基于段落边界句来实现文本分段。
在完成招商项目信息和招商投标信息的分段处理后,即可进行二者间段落相似度的计算,以便利用段落相似度,来确定出目标盘源与各个招商投标信息之间的匹配度,其中,前述计算过程如下述步骤S3所示。
S3.计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度;在本实施例中,招商项目信息对应第一文本段落集合,与各个招商投标信息对应第二文本段落集合之间的相似度,为该第一文本段落集合中各个第一文本段落,与各个第二文本段集合中每个第二文本段落之间的相似度;具体实施时,其相似度计算过程如下述步骤S31~S33。
S31.对于所述第一文本段落集合中的第i个第一文本段落,计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度;在本实施例中,则是以单个第一文本段落为计算单位,分别计算该单个第一文本段落,与第j个第二文本段落集合中每个第二文本段落之间的相似度,计算完毕后,则循环至下个第一文本段落,直至将第一文本段落集合中的第一文本段落轮询完毕时为止;如,假设第一文本段落集合存在3个第一文本段落(分别为1、2、3),那么则是计算第一文本段落1与第j个第二文本段落集合中每个第二文本段落之间的相似度,第一文本段落2与第j个第二文本段落集合中每个第二文本段落之间的相似度,以及第一文本段落3与第j个第二文本段落集合中每个第二文本段落之间的相似度。
在本实施例中,由于第一文本段落与各个第二文本段落之间的相似度计算过程相同,下述以第i个第一文本段落,与第j个第二文本段落集合中的任一第二文本段落为例,来具体阐述前述段落间的相似度计算过程,可以但不限于如下述步骤S31a~S31e所示。
S31a.对于所述第i个第一文本段落和所述第j个第二文本段落集合中的任一第二文本段落,对所述第i个第一文本段落和所述任一第二文本段落进行分句处理,得到所述第i个第一文本段落的招商项目语句集合,以及所述任一第二文本段落的投标语句集合;在本实施例中,举例可以但不限于根据标点符号,生成正则表达式,来进行文本段落的分句;如根据“句号、叹号、问号”等符号进行分句,即将符号判断规则以正则表达式表示,再通过该正则表达式进行前述第i个第一文本段落和前述任一第二文本段落的分句,从而得到招商项目语句集合和投标语句集合。
在完成前述第i个第一文本段落和所述任一第二文本段落的分句后,则可计算各语句之间的相似度,如下述步骤S31b所示。
S31b.对于所述招商项目语句集合中的第h条招商项目语句,计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度;在本实施例中,由于前述就已说明,一个文本段落由若干语句组成,而语句的组成单位是词语,因此,段落之间的相似度,则可基于段落间语句的相似度来度量,而语句间的相似度,则可根据语句中各词语的相似度来计算得到;如此,前述步骤S21b则可细化为下述步骤A~F所示;当然,由于第h条招商项目语句与每条投标语句的相似度计算过程相同,下述步骤A~F是以任一投标语句为例,来具体阐述。
A.对于所述投标语句集合中任一投标语句,对所述第h条招商项目语句和所述任一投标语句进行分词处理,得到招商项目关键词集和投标关键词集;在本实施例中,举例可以但不限于采用最大匹配分词算法、最短路径分算法或生成式模型分词算法(如采用HMM隐马尔可夫模型、朴素贝叶斯分类模型)来对前述第h条招商项目语句和前述任一投标语句进行分词处理,从而得到招商项目关键词集和投标关键词集;当然,前述算法为分词领域的常用技术,其原理不再赘述。
在完成前述第h条招商项目语句和任一投标语句的分词处理后,即可进行两个关键词集中各个词语相似度的计算,如下述步骤B~F所示。
B.判断所述招商项目关键词集中的词语个数是否小于所述投标关键词集中的词语个数。
C.若是,则对所述招商项目关键词集进行词语填充处理,得到填充招商项目关键词集;在本实施例中,步骤B和C主要目的是保证两个关键词集中元素的个数相同,以便后续进行相似度的计算;可选的,举例可以但不限于向招商项目关键词集中填充元素0,且填充的个数则是二者之间的差值;如招商项目关键词集中的词语个数为P,投标关键词集中的词语个数为M,那么填充个数则是M-P;当然,若投标关键词集中的词语个数小于招商项目关键词集中的词语个数,则向投标关键词集中填充0。
在完成前述关键词集的填充处理后,则可进行两关键词集中词语相似度的计算,如下述步骤D和步骤E所示。
D.计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度;在具体实施时,举例可以但不限于先分别将所述第g个招商项目关键词和所述第g个投标关键词转换为one-hot编码,以得到所述第g个招商项目关键词的编码向量以及所述第g个投标关键词的编码向量;然后再计算所述第g个招商项目关键词的编码向量与所述第g个投标关键词的编码向量之间的余弦距离;而后,即可基于二者间的余弦距离得到所述第g个招商项目关键词与所述第g个投标关键词之间的词语相似度。
在本实施例中,one-hot编码称为独热编码,又称一位有效编码,其是采用N位状态寄存器来对N个状态进行编码,且在任意时候只有一位有效,同时,举例可在招商管理端中预设one-hot编码对照表(表中包括各个文字和/或词语对应的one-hot编码),然后在进行编码转换时,可通过遍历one-hot编码对照表,从而查找出前述第g个招商项目关键词和第g个投标关键词的编码向量。
在得到前述两关键词的相似度后,则可计算填充招商项目关键词集与投标关键词集中下一关键词之间的相似度,而后,不断循环,直至将填充招商项目关键词集中的关键词的相似度计算完毕为止,此时,即可得到多个词语相似度,如下述步骤E所示。
E.将g自加1,并重新计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,直至g等于G时,得到G个词语相似度,其中,g的初始值为1,且G为招商项目关键词的总个数。
下述以一个实例来阐述前述步骤:
假设招商项目关键词集中存在招商项目关键词A1、招商项目关键词A2和招商项目关键词A3,投标关键词集中存在投标关键词B1、投标关键词B2和投标关键词B3,那么,则先计算招商项目关键词A1与投标关键词B1之间的相似度,然后,再计算招商项目关键词A2与投标关键词B2之间的相似度;最后,则计算招商项目关键词A3与投标关键词B3之间的相似度;如如此,则可得到3个词语相似度;当然,不同数量的招商项目关键词集与投标关键词集中词语相似度的计算过程与前述举例相同,于此不再赘述。
在得到前述两关键词集中各个关键词之间的相似度后,则可基于各个关键词之间的相似度,来确定出二者关键词集对应语句间的相似度,如下述步骤F所示。
F.利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度;在本实施例中,可先将G个词语相似度中大于或等于词语相似度阈值的词语相似度置0,以及将小于词语相似度阈值的词语相似度置1,得到更新后的词语相似度;然后,计算更新后的词语相似度中目标词语相似度的占比,并判断所述目标词语相似度的占比是否大于或等于语句相似度阈值,其中,所述目标词语相似度为更新后的词语相似度中值为0的词语相似度;最后,则可根据占比结果,来确定出前述两语句间的相似度;即若目标词语相似度的占比大于或等于语句相似度阈值,则将第h条招商项目语句和所述任一投标语句之间的相似度置为0,否则,则将第h条招商项目语句和所述任一投标语句之间的相似度置为1;由此,前述两语句间的相似度则是一个由0和1组成的一维向量,而0的占比越大,则说明二者越相似;可选的,举例词语相似度阈值可以但不限于为0.8,而语句相似度阈值则可以但不限于为0.7。
由此,基于前述步骤A~F相同的原理,即可计算出第h条招商项目语句与投标语句集合中其余各条投标语句之间的相似度,而后,即可利用前述语句间的相似度,组成第h条招商项目语句的相似度向量;接着,再进行招商项目语句集中下一语句,与投标语句集中各条语句间相似度的计算,直至将招商项目语句集中的语句轮询完毕为止,此时,即可得到各条招商项目语句对应的相似度向量;最后,根据前述若干相似度向量,即可计算出第i个第一文本段落与所述任一第二文本段落之间相似度;具体的,计算过程如下述步骤S31c~S31e所示。
S31c.利用所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,组成所述第h条招商项目语句的相似度向量;在本实施例中,举例第h条招商项目语句的相似度向量为行向量,且该行向量的元素则是第h条招商项目语句与各条投标语句之间的相似度;当然,其也是一个由0和1组成的行向量。
在得到第h条招商项目语句的相似度向量后,即可进行下一条招商项目语句的相似度向量的构建,即重复前述步骤S31b以及步骤A~F,以同样的原理计算下一条招商项目语句与各条投标语句之间的相似度,以此不断循环,直至h等于H时,即可得到每条招商项目语句的相似度向量;其中,循环过程如下述步骤S31d所示。
S31d.将h自加1,并重新计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,直至h等于H时,得到每条招商项目语句的相似度向量,其中,h的初始值为1,且H为招商项目语句的总条数;在本实施例中,假设招商项目语句集合中存在3条语句,那么则存在3个相似度向量,如此,即可使用前述3个相似度向量,来构建段落相似度矩阵,如下述步骤S31e所示。
S31e.基于每条招商项目语句的相似度向量,构建所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度矩阵,并依据所述段落相似度矩阵,得出所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度;在本实施例中,举例将每条招商项目语句在招商项目语句集合中的排序号,作为其对应相似度向量的所在行数,从而构建出段落相似度矩阵;如,第一条招商项目语句的相似度向量,作为矩阵的第一行,第二条招商项目语句的相似度向量,则作为矩阵的第二行,以此类推,即可构建得行数为H的段落相似度矩阵。
在具体实施时,由于前述就已说明,相似度向量是0和1组成的行向量,因此,段落相似度矩阵中的元素的值也为0或1,所以,只需统计段落相似度矩阵中0的占比,即可得到第i个第一文本段落与所述任一第二文本段落之间的段落相似度;具体的,若段落相似度矩阵中0的占比大于或等于段落相似度阈值(如可以设置为0.7),则将第i个第一文本段落与所述任一第二文本段落之间的段落相似度置为0,反之,则置为1。
由此通过前述步骤S31及其子步骤,即可得到第i个第一文本段落与第j个第二文本段落集合中单个第二文本段落之间的相似度;而后,以前述相同原理,来计算出第i个第一文本段落,与其余各个第二文本段落之间的相似度,即可得到第i个第一文本段落,与第j个第二文本段落集合中每个第二文本段落之间的相似度。
在将第i个第一文本段落计算完毕后,即可进行下一第一文本段落的计算,其中,下一个第一文本段落与各个第二文本段落间相似度的计算过程与前述第i个第一文本段落的计算过程相同,其循环过程如下述步骤S32所示。
S32.将i自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至i等于n时,得到所述第一文本段落集合与第j个第二文本段落集合之间的段落相似度,其中,i的初始值为1,且n为第一文本段落的总数量;在具体应用时,通过步骤S32,可完成一次相似度计算循环,即计算出各个第一文本段落与第j个第二文本段落集合中每个第二文本段落之间的段落相似度;而后,以前述相同原理,计算第一文本段落集合与第j+1个第二文本段落集合的相似度,直至将所有第二文本段落集合轮询完毕时,即可得到第一文本段落集合与各个第二文本段落集合之间的相似度;其中,循环过程如下述步骤S33所示。
S33.将j自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至j等于x时,得到所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,其中,j的初始值为1,且x为第二文本段落集合的总数量。
由此通过前述步骤S31~S33,即可得到第一文本段落中各个第一文本段落,与任一第二文本段落集合中每个第二文本段落之间的段落相似度;而后,依据各个第一文本段落,与各个第二文本段落之间的段落相似度,即可计算出目标盘源与该任一第二文本段落集合对应招商投标信息之间的招商项目匹配度。
在具体应用时,由于前述就已说明,前述步骤S31~S33计算的是各个第一文本段落,与不同第二文本段落集合中每条第二文本段落之间的相似度;因此,可利用前述各段落间的相似度,来组成招商匹配度矩阵,而后,基于该矩阵,来得出目标盘源与各个招商投标信息之间的匹配度;其中,前述过程可以但不限于如下述步骤S34和步骤S35所示。
S34.对于任一第二文本段落集合,利用所述第一文本段落集合中的各个第一文本段落,与所述任一第二文本段落集合中的每个第二文本段落之间的段落相似度,并按照如下公式(1),构造出所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商匹配度矩阵。
上述式(1)中,S12表示所述招商匹配度矩阵,u1ny21表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第一个第二文本段落之间的段落相似度,u1ny2v表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第v个第二文本段落之间的段落相似度,n表示第一文本段落的总数量,v表示任一第二文本段落中的第二文本段落的总数量,且招商匹配矩阵中各个元素的值为1或0。
S35.基于所述招商匹配度矩阵,计算得到所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商项目匹配度;在本实施例中,可以先统计所述招商匹配度矩阵中目标元素的个数,然后基于所述目标元素的个数以及所述招商匹配度矩阵中元素的总个数,来计算出目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商项目匹配度,其中,所述目标元素为所述招商匹配度矩阵中值为0的元素;更进一步的,举例可以将目标元素的个数与招商匹配度矩阵中元素的总个数之间的比值,作为招商项目匹配度。
下述以一个实例来阐述前述步骤S33和步骤S34:
假设第一文本段落集合存在3个段落(分别为第一文本段落1、2和3),招商投标信息分别为:招商投标信息R1(对应投标用户为企业E1)、招商投标信息R2(对应投标用户为企业E2)和招商投标信息R3(对应投标用户为企业E3),其中,招商投标信息R1对应的第二文本段落集合也存在3个段落(分别为第二文本段落R11、R12和R13)。
可选的,若第一文本段落1与第二文本段落R11之间的段落相似度为0,第一文本段落1与第二文本段落R12之间的段落相似度为1,第一文本段落1与第二文本段落R13之间的段落相似度为0;第一文本段落2与第二文本段落R11之间的段落相似度为1,第一文本段落2与第二文本段落R12之间的段落相似度为1,第一文本段落2与第二文本段落R13之间的段落相似度为0;第一文本段落3与第二文本段落R11之间的段落相似度为1,第一文本段落3与第二文本段落R12之间的段落相似度为1,第一文本段落3与第二文本段落R13之间的段落相似度为0;那么,目标盘源与招商投标信息R1之间的招商匹配度矩阵则为:
如此,基于前述矩阵,即可得出目标盘源与招商投标信息R1之间的招商项目匹配度为:5/9=0.556;当然,前述举例仅是示例,其余不同目标盘源与不同招商投标信息之间的匹配度的计算过程与前述举例相同,于此不再赘述。
在基于前述步骤S3计算得出了目标盘源与各个招商投标信息之间的招商项目匹配度后,即可按照匹配度进行目标盘源对应招商引资用户的推荐;如下述步骤S4所示。
S4.按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数;在本实施例中,招商项目匹配度越大,说明招商投标信息对应用户与目标盘源越匹配,因此,即可按照招商项目匹配度从高到低的顺序,来进行目标盘源对应招商引资用户的推荐;在前述举例的基础上,假设目标盘源与招商投标信息R2之间的招商项目匹配度为0.667,目标盘源与招商投标信息R3之间的招商项目匹配度为0.889,那么,则可将企业E3作为目标盘源的第一推荐招商引资用户,将企业E2作为第二推荐招商引资用户,以及将企业E1作为第三推荐招商引资用户;如此,即可为目标盘源提供最优的招商引资用户,以及备选的招商引资用户;当然,在本实施例中,k的值不限于为3,可根据实际使用而具体确定。
由此通过前述步骤S1~S4所相似描述的写字楼的招商管理方法,本发明充分利用了机器智能化处理手段来实现写字楼中各个盘源的招商要求,与用户的需求之间的识别以及匹配,如此,能够快速匹配出各个盘源的推荐招商引资用户,从而实现写字楼中各盘源的智能化招商管理,不仅节约了大量的人力成本,还提高了推荐的准确性以及效率,适用于在各楼盘产业的招商引资领域的大规模应用与发展。
如图2所示,本实施例第二方面提供了一种实现实施例第一方面中所述的写字楼的招商管理方法的硬件装置,包括:
信息获取单元,用于获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息。
信息处理单元,用于对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合。
招商匹配单元,用于计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度。
招商匹配单元,用于按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数。
本实施例提供的装置的工作过程、工作细节和技术效果,可以参见实施例第一方面,于此不再赘述。
如图3所示,本实施例第三方面提供了另一种写字楼的招商管理装置,以装置为电子设备为例,包括:依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如实施例第一方面所述的写字楼的招商管理方法。
具体举例的,所述存储器可以但不限于包括随机存取存储器(random accessmemory,RAM)、只读存储器(Read Only Memory,ROM)、闪存(Flash Memory)、先进先出存储器(First Input First Output,FIFO)和/或先进后出存储器(First In Last Out,FILO)等等;具体地,处理器可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现,同时,处理器也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。
在一些实施例中,处理器可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制,例如,所述处理器可以不限于采用型号为STM32F105系列的微处理器、精简指令集计算机(reduced instruction setcomputer,RISC)微处理器、X86等架构处理器或集成嵌入式神经网络处理器(neural-network processing units,NPU)的处理器;所述收发器可以但不限于为无线保真(WIFI)无线收发器、蓝牙无线收发器、通用分组无线服务技术(General Packet Radio Service,GPRS)无线收发器、紫蜂协议(基于IEEE802.15.4标准的低功耗局域网协议,ZigBee)无线收发器、3G收发器、4G收发器和/或5G收发器等。此外,所述装置还可以但不限于包括有电源模块、显示屏和其它必要的部件。
本实施例提供的电子设备的工作过程、工作细节和技术效果,可以参见实施例第一方面,于此不再赘述。
本实施例第四方面提供了一种存储包含有实施例第一方面所述的写字楼的招商管理方法的指令的存储介质,即所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如实施例第一方面所述的写字楼的招商管理方法。
其中,所述存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
本实施例提供的存储介质的工作过程、工作细节和技术效果,可以参见实施例第一方面,于此不再赘述。
本实施例第五方面提供了一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行如实施例第一方面所述的写字楼的招商管理方法,其中,所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种写字楼的招商管理方法,其特征在于,包括:
获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息;
对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合;
计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度;
按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数;
采用文本分段模型来对招商项目信息和各个招商投标信息进行文本分段处理;
其中,文本分段模型为训练后的线性分类器;且线性分类器的训练过程为:
(1)获取训练数据集,其中,训练数据集包括多个文本数据;(2)获取每个文本数据的分句数据,得到每个文本数据对应的训练单句集;(3)将训练单句集输入至特征编码器,以得到每个文本数据对应的单句特征集;(4)获取训练单句集中每条训练单句的段落特征,其中,任一条训练单句的段落特征为该任一条训练单句所处的段落位置Z/N,且Z为该任一条训练单句在其对应段落中的句数排序,N为任一条训练单句对应段落的总句数;(5)将每个文本数据的单句特征集,以及每个文本数据的训练单句的段落特征输入至BERT模型中进行特征提取,得到每个文本数据的训练特征集;(6)以各个文本数据的训练特征集为输入,各个文本数据的分段数据为输出,训练线性分类器,以在训练完毕后,得到文本分段模型;
计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,包括:
对于所述第一文本段落集合中的第i个第一文本段落,计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度;
将i自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至i等于n时,得到所述第一文本段落集合与第j个第二文本段落集合之间的段落相似度,其中,i的初始值为1,且n为第一文本段落的总数量;
将j自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至j等于x时,得到所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,其中,j的初始值为1,且x为第二文本段落集合的总数量;
计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,包括:
对于所述第i个第一文本段落和所述第j个第二文本段落集合中的任一第二文本段落,对所述第i个第一文本段落和所述任一第二文本段落进行分句处理,得到所述第i个第一文本段落的招商项目语句集合,以及所述任一第二文本段落的投标语句集合;
对于所述招商项目语句集合中的第h条招商项目语句,计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度;
利用所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,组成所述第h条招商项目语句的相似度向量;
将h自加1,并重新计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,直至h等于H时,得到每条招商项目语句的相似度向量,其中,h的初始值为1,且H为招商项目语句的总条数;
基于每条招商项目语句的相似度向量,构建所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度矩阵,并依据所述段落相似度矩阵,得出所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度;
计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,包括:
对于所述投标语句集合中任一投标语句,对所述第h条招商项目语句和所述任一投标语句进行分词处理,得到招商项目关键词集和投标关键词集;
判断所述招商项目关键词集中的词语个数是否小于所述投标关键词集中的词语个数;
若是,则对所述招商项目关键词集进行词语填充处理,得到填充招商项目关键词集;
计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度;
将g自加1,并重新计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,直至g等于G时,得到G个词语相似度,其中,g的初始值为1,且G为招商项目关键词的总个数;
利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度;
计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,包括:
分别将所述第g个招商项目关键词和所述第g个投标关键词转换为one-hot编码,以得到所述第g个招商项目关键词的编码向量以及所述第g个投标关键词的编码向量;
计算所述第g个招商项目关键词的编码向量与所述第g个投标关键词的编码向量之间的余弦距离,得到所述第g个招商项目关键词与所述第g个投标关键词之间的词语相似度。
2.根据权利要求1所述的方法,其特征在于,利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度,包括:
将G个词语相似度中大于或等于词语相似度阈值的词语相似度置0,以及将小于词语相似度阈值的词语相似度置1,得到更新后的词语相似度;
计算更新后的词语相似度中目标词语相似度的占比,并判断所述目标词语相似度的占比是否大于或等于语句相似度阈值,其中,所述目标词语相似度为更新后的词语相似度中值为0的词语相似度;
若是,则将第h条招商项目语句和所述任一投标语句之间的相似度置为0,否则,则将第h条招商项目语句和所述任一投标语句之间的相似度置为1。
3.根据权利要求1所述的方法,其特征在于,所述第一文本段落集合与任一第二文本段落集合之间的段落相似度包括:所述第一文本段落集合中的各个第一文本段落,与所述任一第二文本段落集合中的每个第二文本段落之间的段落相似度;
其中,利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度,包括:
对于任一第二文本段落集合,利用所述第一文本段落集合中的各个第一文本段落,与所述任一第二文本段落集合中的每个第二文本段落之间的段落相似度,并按照如下公式(1),构造出所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商匹配度矩阵;
(1)
上述式(1)中,表示所述招商匹配度矩阵,/>表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第一个第二文本段落之间的段落相似度,表示第一文本段落集合中的第n个第一文本段落与所述任一第二文本段落中的第v个第二文本段落之间的段落相似度,n表示第一文本段落的总数量,v表示任一第二文本段落中的第二文本段落的总数量;
基于所述招商匹配度矩阵,计算得到所述目标盘源与所述任一第二文本段落集合对应招商投标信息之间的招商项目匹配度。
4.一种写字楼的招商管理装置,其特征在于,包括:
信息获取单元,用于获取写字楼中目标盘源的招商项目信息,以及写字楼的若干投标用户的招商投标信息,其中,任一投标用户的招商投标信息包括该任一投标用户的用户信息和入驻需求信息;
信息处理单元,用于对所述招商项目信息进行文本分段处理,得到所述招商项目信息的第一文本段落集合,以及对所述若干投标用户的招商投标信息中的每个投标用户的招商投标信息进行文本分段处理,得到每个招商投标信息的第二文本段落集合;
招商匹配单元,用于计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,并利用所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,计算得到所述目标盘源与各个招商投标信息之间的招商项目匹配度;
招商匹配单元,用于按照招商项目匹配度从高到低的顺序,对各个招商投标信息对应的投标用户进行排序,并选取排序前k位的投标用户,作为所述目标盘源的推荐招商引资用户,其中,k为正整数;
采用文本分段模型来对招商项目信息和各个招商投标信息进行文本分段处理,其中,文本分段模型为训练后的线性分类器,且线性分类器的训练过程为:
(1)获取训练数据集,其中,训练数据集包括多个文本数据;(2)获取每个文本数据的分句数据,得到每个文本数据对应的训练单句集;(3)将训练单句集输入至特征编码器,以得到每个文本数据对应的单句特征集;(4)获取训练单句集中每条训练单句的段落特征,其中,任一条训练单句的段落特征为该任一条训练单句所处的段落位置Z/N,且Z为该任一条训练单句在其对应段落中的句数排序,N为任一条训练单句对应段落的总句数;(5)将每个文本数据的单句特征集,以及每个文本数据的训练单句的段落特征输入至BERT模型中进行特征提取,得到每个文本数据的训练特征集;(6)以各个文本数据的训练特征集为输入,各个文本数据的分段数据为输出,训练线性分类器,以在训练完毕后,得到文本分段模型;
计算所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,包括:
对于所述第一文本段落集合中的第i个第一文本段落,计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度;
将i自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至i等于n时,得到所述第一文本段落集合与第j个第二文本段落集合之间的段落相似度,其中,i的初始值为1,且n为第一文本段落的总数量;
将j自加1,并重新计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,直至j等于x时,得到所述第一文本段落集合与各个第二文本段落集合之间的段落相似度,其中,j的初始值为1,且x为第二文本段落集合的总数量;
计算所述第i个第一文本段落与第j个第二文本段落集合中各个第二文本段落之间的段落相似度,包括:
对于所述第i个第一文本段落和所述第j个第二文本段落集合中的任一第二文本段落,对所述第i个第一文本段落和所述任一第二文本段落进行分句处理,得到所述第i个第一文本段落的招商项目语句集合,以及所述任一第二文本段落的投标语句集合;
对于所述招商项目语句集合中的第h条招商项目语句,计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度;
利用所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,组成所述第h条招商项目语句的相似度向量;
将h自加1,并重新计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,直至h等于H时,得到每条招商项目语句的相似度向量,其中,h的初始值为1,且H为招商项目语句的总条数;
基于每条招商项目语句的相似度向量,构建所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度矩阵,并依据所述段落相似度矩阵,得出所述第i个第一文本段落与所述任一第二文本段落之间的段落相似度;
计算所述第h条招商项目语句与所述投标语句集合中的各条投标语句之间的相似度,包括:
对于所述投标语句集合中任一投标语句,对所述第h条招商项目语句和所述任一投标语句进行分词处理,得到招商项目关键词集和投标关键词集;
判断所述招商项目关键词集中的词语个数是否小于所述投标关键词集中的词语个数;
若是,则对所述招商项目关键词集进行词语填充处理,得到填充招商项目关键词集;
计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度;
将g自加1,并重新计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,直至g等于G时,得到G个词语相似度,其中,g的初始值为1,且G为招商项目关键词的总个数;
利用G个词语相似度,确定出所述第h条招商项目语句和所述任一投标语句之间的相似度;
计算所述填充招商项目关键词集中的第g个招商项目关键词,与所述投标关键词集中的第g个投标关键词之间的词语相似度,包括:
分别将所述第g个招商项目关键词和所述第g个投标关键词转换为one-hot编码,以得到所述第g个招商项目关键词的编码向量以及所述第g个投标关键词的编码向量;
计算所述第g个招商项目关键词的编码向量与所述第g个投标关键词的编码向量之间的余弦距离,得到所述第g个招商项目关键词与所述第g个投标关键词之间的词语相似度。
5.一种电子设备,其特征在于,包括:依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如权利要求1~3任意一项所述的写字楼的招商管理方法。
6.一种存储介质,其特征在于,所述存储介质上存储有指令,当所述指令在计算机上运行时,执行如权利要求1~3任意一项所述的写字楼的招商管理方法。
CN202310262709.8A 2023-03-10 2023-03-10 一种写字楼的招商管理方法、装置、电子设备及存储介质 Active CN116188125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310262709.8A CN116188125B (zh) 2023-03-10 2023-03-10 一种写字楼的招商管理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310262709.8A CN116188125B (zh) 2023-03-10 2023-03-10 一种写字楼的招商管理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116188125A CN116188125A (zh) 2023-05-30
CN116188125B true CN116188125B (zh) 2024-05-31

Family

ID=86438566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310262709.8A Active CN116188125B (zh) 2023-03-10 2023-03-10 一种写字楼的招商管理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116188125B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778817B1 (en) * 2000-09-30 2010-08-17 Intel Corporation Method and apparatus for determining text passage similarity
CN110020191A (zh) * 2018-07-19 2019-07-16 平安科技(深圳)有限公司 电子装置、招商引资的目标对象确定方法及存储介质
WO2022078308A1 (zh) * 2020-10-12 2022-04-21 深圳壹账通智能科技有限公司 裁判文书摘要生成方法、装置、电子设备及可读存储介质
CN114492367A (zh) * 2022-01-21 2022-05-13 武汉东湖大数据交易中心股份有限公司 一种产业招商线索发现方法、系统、设备及存储介质
CN115269512A (zh) * 2022-07-26 2022-11-01 北京来也网络科技有限公司 结合rpa及ai实现ia的对象推荐方法、装置及存储介质
WO2022262266A1 (zh) * 2021-06-18 2022-12-22 平安科技(深圳)有限公司 文本摘要生成方法、装置、计算机设备及存储介质
CN115630226A (zh) * 2022-10-25 2023-01-20 汇辰技术服务(贵州)有限公司 招投标项目信息推送方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291684B (zh) * 2016-04-12 2021-02-09 华为技术有限公司 语言文本的分词方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7778817B1 (en) * 2000-09-30 2010-08-17 Intel Corporation Method and apparatus for determining text passage similarity
CN110020191A (zh) * 2018-07-19 2019-07-16 平安科技(深圳)有限公司 电子装置、招商引资的目标对象确定方法及存储介质
WO2022078308A1 (zh) * 2020-10-12 2022-04-21 深圳壹账通智能科技有限公司 裁判文书摘要生成方法、装置、电子设备及可读存储介质
WO2022262266A1 (zh) * 2021-06-18 2022-12-22 平安科技(深圳)有限公司 文本摘要生成方法、装置、计算机设备及存储介质
CN114492367A (zh) * 2022-01-21 2022-05-13 武汉东湖大数据交易中心股份有限公司 一种产业招商线索发现方法、系统、设备及存储介质
CN115269512A (zh) * 2022-07-26 2022-11-01 北京来也网络科技有限公司 结合rpa及ai实现ia的对象推荐方法、装置及存储介质
CN115630226A (zh) * 2022-10-25 2023-01-20 汇辰技术服务(贵州)有限公司 招投标项目信息推送方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于文本空间表示模型的文本相似度计算研究;张文萍;黎春兰;;现代情报(02);第1-4页 *

Also Published As

Publication number Publication date
CN116188125A (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN113822494B (zh) 风险预测方法、装置、设备及存储介质
CN111914054B (zh) 用于大规模语义索引的系统和方法
CN111680168B (zh) 文本特征语义提取方法、装置、电子设备及存储介质
CN112633973B (zh) 一种商品推荐方法及其相关设备
CN112231485B (zh) 文本推荐方法、装置、计算机设备及存储介质
CN112380859A (zh) 舆情信息的推荐方法、装置、电子设备及计算机存储介质
CN109598586A (zh) 一种基于注意力模型的推荐方法
CN110110213B (zh) 挖掘用户职业的方法、装置、计算机可读存储介质和终端设备
CN115392237B (zh) 情感分析模型训练方法、装置、设备及存储介质
CN108804544A (zh) 互联网影视多源数据融合方法和装置
CN110110035A (zh) 数据处理方法和装置以及计算机可读存储介质
CN113868529A (zh) 知识推荐方法、装置、电子设备及可读存储介质
CN116188125B (zh) 一种写字楼的招商管理方法、装置、电子设备及存储介质
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN112036439A (zh) 依存关系分类方法及相关设备
CN110213239B (zh) 可疑交易报文生成方法、装置及服务器
CN112507728A (zh) 智能对话方法、装置、电子设备及存储介质
CN114969343B (zh) 结合相对位置信息的弱监督文本分类方法
CN106484782A (zh) 一种基于多核哈希学习的大规模医学图像检索方法
CN110502236A (zh) 基于多尺度特征解码的前端代码生成方法、系统及设备
CN115345669A (zh) 文案生成方法、装置、存储介质及计算机设备
CN114757154A (zh) 基于深度学习的作业生成方法、装置、设备及存储介质
CN114708073A (zh) 一种围标串标智能检测方法、装置、电子设备及存储介质
Denli et al. Geoscience language processing for exploration
CN113887201A (zh) 文本定长纠错方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant