CN114418609A - 成交概率预估方法、存储介质及程序产品 - Google Patents

成交概率预估方法、存储介质及程序产品 Download PDF

Info

Publication number
CN114418609A
CN114418609A CN202111521694.XA CN202111521694A CN114418609A CN 114418609 A CN114418609 A CN 114418609A CN 202111521694 A CN202111521694 A CN 202111521694A CN 114418609 A CN114418609 A CN 114418609A
Authority
CN
China
Prior art keywords
time
feature vector
static
time sequence
deal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111521694.XA
Other languages
English (en)
Inventor
刘�英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shell Housing Network Beijing Information Technology Co Ltd
Original Assignee
Shell Housing Network Beijing Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shell Housing Network Beijing Information Technology Co Ltd filed Critical Shell Housing Network Beijing Information Technology Co Ltd
Priority to CN202111521694.XA priority Critical patent/CN114418609A/zh
Publication of CN114418609A publication Critical patent/CN114418609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种成交概率预估方法、存储介质及程序产品,该方法包括:将客户静态属性数据输入静态特征提取模块得到静态特征向量;将客户行为序列数据输入时序特征提取模块得到第一时序特征向量;将静态特征向量和第一时序特征向量分别输入到注意力模块得到第二时序特征向量;将静态特征向量和第二时序特征向量进行拼接后输入到成交概率预估模型的输出层,得到成交概率预估模型输出的成交概率。本发明实施例通过利用注意力机制将静态特征向量和第一时序特征向量结合,得到了基于不同静态特征向量的个性化第二时序特征向量,可以学习到不同类型客户行为时序的差异,能够更加准确地表征时序特征,显著地提高成交概率预估的准确性。

Description

成交概率预估方法、存储介质及程序产品
技术领域
本发明实施例涉及一种成交概率预估方法、存储介质及程序产品。
背景技术
成交概率可以反映客户购买意愿的强弱,成交概率预估是精细化运营和精准营销服务的基础。可以挑选出那些购买意愿比较强的目标客户,优先投放更多的营销服务。例如对于房源交易平台而言,一个客户签前的流程,包括浏览,商机,带看,签约等流程,需要经纪人的高质量的服务。通过对客户进行成交概率预估,从而提供相应的服务至关重要。
现有的成交概率预估方法中,依据特征提取模块的不同,分为基于静态特征提取的方法和基于时序特征提取的方法。基于静态特征提取的方法,即除了客户活跃度等客户属性以外,会把用户近期的不同行为统计结果作为行为特征,这种方法忽略了客户行为的时序性和行为细节,不能准确及时的刻画客户。而基于时序特征提取的方法,多使用LSTM(Long Short-Term Memory,长短期记忆网络)等模块对客户的行为序列建模,但没有考虑客户的静态属性,忽略客户个体差异。
发明内容
为解决现有技术中的问题,本发明实施例提供一种成交概率预估方法、存储介质及程序产品。
本发明实施例提供一种成交概率预估方法,包括:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
根据本发明实施例提供的一种成交概率预估方法,所述时序特征提取模块包括多个顺序相连的神经网络时步单元;所述将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量,包括:将所述客户行为序列数据按序列顺序分别作为多个所述神经网络时步单元的输入,每个所述神经网络时步单元分别输出一个时步特征向量,多个顺序相连的所述神经网络时步单元输出的多个所述时步特征向量组成所述第一时序特征向量。
根据本发明实施例提供的一种成交概率预估方法,所述将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量,包括:将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重;根据所述时步特征向量权重将所述时步特征向量进行加权求和,得到所述第二时序特征向量。
根据本发明实施例提供的一种成交概率预估方法,所述将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重,包括:将每个所述时步特征向量与所述静态特征向量分别进行内积计算,得到每个所述时步特征向量的分值;将所述时步特征向量的分值进行归一化处理,得到每个所述时步特征向量的时步特征向量权重。
根据本发明实施例提供的一种成交概率预估方法,所述静态特征提取模块包括深度神经网络,所述时序特征提取模块包括长短期记忆网络。
根据本发明实施例提供的一种成交概率预估方法,所述客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种;和/或,所述客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种。
根据本发明实施例提供的一种成交概率预估方法,所述输出层包括顺序连接的全连接层和激活层。
根据本发明实施例提供的一种成交概率预估方法,所述成交概率预估模型是以客户静态属性数据样本和客户行为序列数据样本作为输入,以成交情况作为输出标签训练得到的。
本发明实施例还提供一种成交概率预估装置,包括:静态特征向量获取模块,用于:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;第一时序特征向量获取模块,用于:将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;第二时序特征向量获取模块,用于:将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;成交概率获取模块,用于:将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述成交概率预估方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述成交概率预估方法的步骤。
本发明实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述成交概率预估方法的步骤。
本发明实施例提供的成交概率预估方法、存储介质及程序产品,通过利用注意力机制将根据客户静态属性数据提取的静态特征向量和根据客户行为序列数据提取的第一时序特征向量结合,得到了基于不同静态特征向量的个性化第二时序特征向量,可以学习到不同类型客户行为时序的差异,能够更加准确地表征时序特征,显著地提高成交概率预估的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是一些方案中的成交概率预估模型的结构示意图;
图2是本发明实施例提供的成交概率预估方法的流程示意图;
图3是本发明实施例提供的成交概率预估方法中成交概率预估模型的结构示意图;
图4是本发明实施例提供的成交概率预估装置的结构示意图;
图5是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是一些方案中的成交概率预估模型的结构示意图。如图1所示,这种成交概率预估模型,分为DNN(Deep Neural Networks,深度神经网络)和LSTM两部分,静态属性数据输入DNN中进行静态特征提取,行为序列数据输入LSTM中进行时序特征提取,两者的输出进行融合,经过一层全连接层,输出至激活函数,最终得到模型的输出。发明人发现,这种方法中静态属性数据和行为序列数据分成两个模块分别进行特征提取,然后将提取的特征直接拼接在一起,忽略了两个模块的内在联系,如不同类型客户行为时序的差异。
图2是本发明实施例提供的成交概率预估方法的流程示意图。如图2所示,所述方法包括:
步骤101、将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量。
成交概率预估模型用于预估客户的成交概率,从而对客户的购买意愿进行预估。成交概率预估模型可以根据输入的客户静态属性数据和客户行为序列数据得到成交概率。成交概率预估模型包括静态特征提取模块,用于接收输入的客户静态属性数据,进行静态特征提取,得到静态特征向量。
其中,客户静态属性数据用于反映不同客户的静态特点,以房地产领域为例,比如可以包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据等。客户自身属性数据为表征客户自身属性特征的数据,比如可以包括客活跃度、客户类型、委托日期及所处的买房状态等;客户偏好的房屋属性数据为表征客-房特征的数据,比如客户偏好的房屋的居室数量;客户与经纪人的交互统计数据为表征客户-经纪人交互特征的数据,比如可以是用于表示客户和经纪人的联系紧密程度的统计数据。客户静态属性数据可以根据业务的具体需求灵活设置。
静态特征提取模块可以采用能够提取静态特征的神经网络进行静态特征提取,如DNN、CNN(Convolutional Neural Network,卷积神经网络)等。
步骤102、将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量。
成交概率预估模型包括时序特征提取模块,用于接收输入的客户行为序列数据,进行时序特征提取,得到第一时序特征向量。
客户行为序列数据用于反映不同客户的动态特点,比如可以包括线上行为的时序数据、线上行为统计数据的时序分布数据等。以房地产领域为例,线上行为的时序数据比如近14天客户的行为房序列,行为房表示用户发生了浏览、关注、商机(如通过即时通讯系统IM询问经纪人该房源相关信息)等的房源;线上行为统计数据的时序分布数据比如近14天每天的行为量、近14天客户的偏好变化等。客户行为序列数据可以根据业务的具体需求灵活设置。
时序特征提取模块可以采用能够提取时序特征的神经网络进行时序特征提取,如LSTM、TsFresh等。
步骤103、将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量。
成交概率预估模型包括注意力模块,用于通过注意力机制将输入的静态特征向量和第一时序特征向量相结合,得到第二时序特征向量。通过注意力机制将输入的静态特征向量和第一时序特征向量相结合,实现依据不同的静态特征对时序特征进行个性化表征,加强了时序特征的提取。因此,通过注意力机制将静态特征向量和第一时序特征向量相结合得到的第二时序特征向量可以体现出不同客户类型的个性化时序特征,能够更准确地描述客户的特点。
步骤104、将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
本发明实施例提供的成交概率预估方法,采用将静态特征向量和第二时序特征向量相结合的方法得到成交概率。具体地,将静态特征向量和第二时序特征向量进行拼接后输入到成交概率预估模型的输出层,得到成交概率预估模型输出的成交概率。
将客户静态属性数据输入到训练好的成交概率预估模型的静态特征提取模块,将客户行为序列数据输入到训练好的成交概率预估模型的时序特征提取模块,在成交概率预估模型的输出端输出成交概率。
本发明实施例提供的成交概率预估方法,通过利用注意力机制将根据客户静态属性数据提取的静态特征向量和根据客户行为序列数据提取的第一时序特征向量结合,得到了基于不同静态特征向量的个性化第二时序特征向量,可以学习到不同类型客户行为时序的差异,能够更加准确地表征时序特征,显著地提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估方法,所述时序特征提取模块包括多个顺序相连的神经网络时步单元;所述将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量,包括:将所述客户行为序列数据按序列顺序分别作为多个所述神经网络时步单元的输入,每个所述神经网络时步单元分别输出一个时步特征向量,多个顺序相连的所述神经网络时步单元输出的多个所述时步特征向量组成所述第一时序特征向量。
时序特征提取模块包括多个顺序相连的神经网络时步单元,用于对各个时间步的客户行为序列数据进行处理。在将客户行为序列数据输入成交概率预估模型的时序特征提取模块,得到第一时序特征向量时,将客户行为序列数据按照时间步的序列顺序分别作为多个神经网络时步单元的输入,每个神经网络时步单元分别输出一个时步特征向量,多个顺序相连的神经网络时步单元输出的多个时步特征向量组成第一时序特征向量。第一时序特征向量可以体现各个时间步的客户行为序列数据的特征。
本发明实施例提供的成交概率预估方法,通过在时序特征提取模块设置包括多个顺序相连的神经网络时步单元,将客户行为序列数据按序列顺序分别作为多个神经网络时步单元的输入,每个神经网络时步单元分别输出一个时步特征向量,多个顺序相连的神经网络时步单元输出的多个时步特征向量组成第一时序特征向量,实现了时间步维度上时序特征的获取。
根据本发明实施例提供的一种成交概率预估方法,所述将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量,包括:将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重;根据所述时步特征向量权重将所述时步特征向量进行加权求和,得到所述第二时序特征向量。
在将静态特征向量和第一时序特征向量分别输入到成交概率预估模型的注意力模块,得到第二时序特征向量时,将静态特征向量和第一时序特征向量的时步特征向量分别输入到成交概率预估模型的注意力模块,根据静态特征向量和时步特征向量计算交叉特征得到每个时步特征向量的时步特征向量权重。根据时步特征向量权重将时步特征向量进行加权求和,得到第二时序特征向量。
本发明实施例提供的成交概率预估装置,通过基于静态特征向量得到每个时间步上的时步特征向量的权重,将时步特征向量加权求和得到第二时序特征向量,在计算第二时序特征向量的过程中考虑了每个时间步上的时序特征,并引入了静态特征向量进行时序特征表达,实现了第二时序特征向量更加准确和丰富的表达,有利于进一步提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估方法,所述将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重,包括:将每个所述时步特征向量与所述静态特征向量分别进行内积计算,得到每个所述时步特征向量的分值;将所述时步特征向量的分值进行归一化处理,得到每个所述时步特征向量的时步特征向量权重。
第一时序特征向量包括多个对应时间步的时步特征向量。在将静态特征向量和第一时序特征向量分别输入到成交概率预估模型的注意力模块,得到第二时序特征向量时,将静态特征向量和第一时序特征向量的多个时步特征向量分别输入到成交概率预估模型的注意力模块,将静态特征向量和时步特征向量分别通过进行内积计算求取交叉特征,将得到的交叉特征作为时步特征向量的分值。内积计算结果可以表示相应时间步的时步特征向量的重要度。将时步特征向量的分值通过归一化处理,如通过softmax函数做归一化处理,得到时步特征向量权重。根据时步特征向量权重将时步特征向量进行加权求和,得到第二时序特征向量。
图3是本发明实施例提供的成交概率预估方法中成交概率预估模型的结构示意图。如图3所示,静态特征提取模块采用DNN,用于提取静态特征,得到静态部分的特征表达;时序特征提取模块采用LSTM,得到时序的每个时间步上的原始特征表达(时步特征向量)。将DNN输出的静态特征向量和LSTM产出的每个时间步的时步特征向量输入到注意力模块(Attention),在注意力模块中,将DNN输出的静态特征向量和LSTM产出的每个时间步的时步特征向量做内积得到该时间步对应的时步特征向量的分数,然后通过softmax做归一化,得到每个时间步对应的时步特征向量的权重,最后把每个时间步的时步特征向量用权重加权求和得到最后的时序特征的表达(第二时序特征向量)。最后将DNN的静态特征向量和注意力模块输出的第二特征向量拼接在一起,再经过几层全连接层,输出至激活函数,最终得到模型的输出,即成交概率。
本发明实施例提供的成交概率预估方法,通过将每个时步特征向量与静态特征向量分别进行内积计算,得到每个时步特征向量的分值,将时步特征向量的分值进行归一化处理,得到每个时步特征向量的时步特征向量权重,实现了时步特征向量权重的简便化获取,同时提高了时步特征向量权重的准确性,从而有利于提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估方法,所述静态特征提取模块包括深度神经网络,所述时序特征提取模块包括长短期记忆网络。
静态特征提取模块可以采用深度神经网络(DNN)进行静态特征提取,时序特征提取模块可以采用长短期记忆网络(LSTM)进行时序特征提取。
本发明实施例提供的成交概率预估方法,通过利用深度神经网络进行静态特征提取,利用长短期记忆网络进行时序特征提取,实现了静态特征和时序特征的可靠提取,有利于提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估方法,所述客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种;和/或,所述客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种。
本发明实施例提供的成交概率预估方法,通过设置客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种,和/或,客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种,实现了客户静态属性数据和客户行为序列数据的灵活设置。
根据本发明实施例提供的一种成交概率预估方法,所述输出层包括顺序连接的全连接层和激活层。
在将静态特征向量和第二时序特征向量进行拼接后输入到成交概率预估模型输出层,得到成交概率预估模型输出的成交概率时,通过将静态特征向量和第二时序特征向量进行拼接后输入到成交概率预估模型的全连接层,并将全连接层的输出经过激活层的激活函数处理后,得到成交概率预估模型输出的成交概率。全连接层的层数可以根据计算量和数据处理需求确定。
本发明实施例提供的成交概率预估方法,通过对静态特征向量和第二时序特征向量进行拼接后的向量进行全连接处理及激活函数处理后得到成交概率,实现了输出结果的简便化获取。
根据本发明实施例提供的一种成交概率预估方法,所述成交概率预估模型是以客户静态属性数据样本和客户行为序列数据样本作为输入,以成交情况作为输出标签训练得到的。
要利用成交概率预估模型根据输入的客户静态属性数据和客户行为序列数据得到成交概率,需要预先训练成交概率预估模型。训练时,将客户静态属性数据样本输入到静态特征提取模块,将客户行为序列数据样本输入到时序特征提取模块,在模型输出端根据客户静态属性数据样本和客户行为序列数据样本对应客户的成交情况作为输出标签,比如成交设置为1,未成交设置为0,进行神经网络的训练,最终得到训练好的成交概率预估模型。
成交概率预估模型对于客户静态属性数据样本和客户行为序列数据样本的处理过程与对客户静态属性数据和客户行为序列数据的处理过程相同。
本发明实施例提供的成交概率预估方法,通过预先根据样本通过有监督训练得到成交概率预估模型,为利用成交概率预估模型进行成交概率预估提供基础。
下面对本发明实施例提供的成交概率预估装置进行描述,下文描述的成交概率预估装置与上文描述的成交概率预估方法可相互对应参照。
图4是本发明实施例提供的成交概率预估装置的结构示意图。如图4所示,所述装置包括静态特征向量获取模块10、第一时序特征向量获取模块20、第二时序特征向量获取模块30及成交概率获取模块40,其中:静态特征向量获取模块10用于:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;第一时序特征向量获取模块20用于:将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;第二时序特征向量获取模块30用于:将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;成交概率获取模块40用于:将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
本发明实施例提供的成交概率预估装置,通过利用注意力机制将根据客户静态属性数据提取的静态特征向量和根据客户行为序列数据提取的第一时序特征向量结合,得到了基于不同静态特征向量的个性化第二时序特征向量,可以学习到不同类型客户行为时序的差异,能够更加准确地表征时序特征,显著地提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估装置,所述时序特征提取模块包括多个顺序相连的神经网络时步单元;第一时序特征向量获取模块20在用于将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量时,具体用于:将所述客户行为序列数据按序列顺序分别作为多个所述神经网络时步单元的输入,每个所述神经网络时步单元分别输出一个时步特征向量,多个顺序相连的所述神经网络时步单元输出的多个所述时步特征向量组成所述第一时序特征向量。
本发明实施例提供的成交概率预估装置,通过在时序特征提取模块设置包括多个顺序相连的神经网络时步单元,将所述客户行为序列数据按序列顺序分别作为多个所述神经网络时步单元的输入,每个所述神经网络时步单元分别输出一个时步特征向量,多个顺序相连的所述神经网络时步单元输出的多个所述时步特征向量组成所述第一时序特征向量,实现了时间步维度上时序特征的获取。
根据本发明实施例提供的一种成交概率预估装置,第二时序特征向量获取模块30在用于将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量时,具体用于:将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重;根据所述时步特征向量权重将所述时步特征向量进行加权求和,得到所述第二时序特征向量。
本发明实施例提供的成交概率预估装置,通过基于静态特征向量得到每个时间步上的时步特征向量的权重,将时步特征向量加权求和得到第二时序特征向量,在计算第二时序特征向量的过程中考虑了每个时间步上的时序特征,并引入了静态特征向量进行时序特征表达,实现了第二时序特征向量更加准确和丰富的表达,有利于进一步提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估装置,第二时序特征向量获取模块30在用于将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重时,具体用于:将每个所述时步特征向量与所述静态特征向量分别进行内积计算,得到每个所述时步特征向量的分值;将所述时步特征向量的分值进行归一化处理,得到每个所述时步特征向量的时步特征向量权重。
本发明实施例提供的成交概率预估装置,通过将每个时步特征向量与静态特征向量分别进行内积计算,得到每个时步特征向量的分值,将时步特征向量的分值进行归一化处理,得到每个时步特征向量的时步特征向量权重,实现了时步特征向量权重的简便化获取,提高了时步特征向量权重的准确性,从而有利于提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估装置,所述静态特征提取模块包括深度神经网络,所述时序特征提取模块包括长短期记忆网络。
本发明实施例提供的成交概率预估装置,通过利用深度神经网络进行静态特征提取,利用长短期记忆网络进行时序特征提取,实现了静态特征和时序特征的可靠提取,有利于提高成交概率预估的准确性。
根据本发明实施例提供的一种成交概率预估装置,所述客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种;和/或,所述客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种。
本发明实施例提供的成交概率预估装置,通过设置客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种,和/或,客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种,实现了客户静态属性数据和客户行为序列数据的灵活设置。根据本发明实施例提供的一种成交概率预估装置,所述输出层包括顺序连接的全连接层和激活层。
本发明实施例提供的成交概率预估装置,通过对静态特征向量和第二时序特征向量进行拼接后的向量进行全连接及激活处理后的,得到成交概率,实现了输出结果的简便化获取。
根据本发明实施例提供的一种成交概率预估装置,所述成交概率预估模型是以客户静态属性数据样本和客户行为序列数据样本作为输入,以成交情况作为输出标签训练得到的。
本发明实施例提供的成交概率预估装置,通过预先根据样本通过有监督训练得到成交概率预估模型,为利用成交概率预估模型进行成交概率预估提供基础。
图5是本发明实施例提供的电子设备的结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行成交概率预估方法,该方法包括:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的成交概率预估方法,该方法包括:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的成交概率预估方法,该方法包括:将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种成交概率预估方法,其特征在于,包括:
将客户静态属性数据输入成交概率预估模型的静态特征提取模块,得到静态特征向量;
将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量;
将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量;
将所述静态特征向量和所述第二时序特征向量进行拼接后输入到所述成交概率预估模型的输出层,得到所述成交概率预估模型输出的成交概率。
2.根据权利要求1所述的成交概率预估方法,其特征在于,
所述时序特征提取模块包括多个顺序相连的神经网络时步单元;
所述将客户行为序列数据输入所述成交概率预估模型的时序特征提取模块,得到第一时序特征向量,包括:
将所述客户行为序列数据按序列顺序分别作为多个所述神经网络时步单元的输入,每个所述神经网络时步单元分别输出一个时步特征向量,多个顺序相连的所述神经网络时步单元输出的多个所述时步特征向量组成所述第一时序特征向量。
3.根据权利要求2所述的成交概率预估方法,其特征在于,所述将所述静态特征向量和所述第一时序特征向量分别输入到所述成交概率预估模型的注意力模块,得到第二时序特征向量,包括:
将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重;根据所述时步特征向量权重将所述时步特征向量进行加权求和,得到所述第二时序特征向量。
4.根据权利要求3所述的成交概率预估方法,其特征在于,所述将所述静态特征向量和所述第一时序特征向量的所述时步特征向量分别输入到所述成交概率预估模型的注意力模块,得到每个所述时步特征向量的时步特征向量权重,包括:
将每个所述时步特征向量与所述静态特征向量分别进行内积计算,得到每个所述时步特征向量的分值;
将所述时步特征向量的分值进行归一化处理,得到每个所述时步特征向量的时步特征向量权重。
5.根据权利要求1所述的成交概率预估方法,其特征在于,所述静态特征提取模块包括深度神经网络,所述时序特征提取模块包括长短期记忆网络。
6.根据权利要求1所述的成交概率预估方法,其特征在于,所述客户静态属性数据包括客户自身属性数据、客户偏好的房屋属性数据以及客户与经纪人的交互统计数据中的至少一种;
和/或,所述客户行为序列数据包括线上行为的时序数据以及线上行为统计数据的时序分布数据中的至少一种。
7.根据权利要求1所述的成交概率预估方法,其特征在于,所述输出层包括顺序连接的全连接层和激活层。
8.根据权利要求1所述的成交概率预估方法,其特征在于,所述成交概率预估模型是以客户静态属性数据样本和客户行为序列数据样本作为输入,以成交情况作为输出标签训练得到的。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述成交概率预估方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述成交概率预估方法的步骤。
CN202111521694.XA 2021-12-13 2021-12-13 成交概率预估方法、存储介质及程序产品 Pending CN114418609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111521694.XA CN114418609A (zh) 2021-12-13 2021-12-13 成交概率预估方法、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111521694.XA CN114418609A (zh) 2021-12-13 2021-12-13 成交概率预估方法、存储介质及程序产品

Publications (1)

Publication Number Publication Date
CN114418609A true CN114418609A (zh) 2022-04-29

Family

ID=81265202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111521694.XA Pending CN114418609A (zh) 2021-12-13 2021-12-13 成交概率预估方法、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN114418609A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187632A (zh) * 2022-09-08 2023-05-30 贝壳找房(北京)科技有限公司 行为预测模型训练方法、房源匹配方法、装置及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116187632A (zh) * 2022-09-08 2023-05-30 贝壳找房(北京)科技有限公司 行为预测模型训练方法、房源匹配方法、装置及存储介质

Similar Documents

Publication Publication Date Title
CN112732911B (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
EP4242955A1 (en) User profile-based object recommendation method and device
CN109961080B (zh) 终端识别方法及装置
CN113379449B (zh) 多媒体资源召回方法、装置、电子设备以及存储介质
CN109685536B (zh) 用于输出信息的方法和装置
CN110796484A (zh) 客户活跃程度预测模型的构建方法、装置及其应用方法
CN112287238B (zh) 用户特征的确定方法和装置、存储介质及电子设备
CN112036954A (zh) 物品推荐方法和装置、计算机可读存储介质、电子设备
CN113763019A (zh) 一种用户信息管理方法和装置
CN113592593A (zh) 序列推荐模型的训练及应用方法、装置、设备及存储介质
CN117057873A (zh) 商品描述内容生成方法及其装置、设备、介质
CN114418609A (zh) 成交概率预估方法、存储介质及程序产品
CN113568739B (zh) 用户资源额度分配方法、装置及电子设备
CN115203516A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备
CN114860912B (zh) 数据处理方法、装置、电子设备和存储介质
CN112035613B (zh) 基于多轮对话的信息推送方法及装置、存储介质、电子装置
CN116911954B (zh) 基于兴趣和流行度推荐物品的方法及装置
CN111696533B (zh) 网点机器人自调节方法及装置
WO2023119672A1 (ja) 推定方法、推定装置及び推定プログラム
CN114912934A (zh) 用户意愿识别方法、装置以及电子设备
CN113849614A (zh) 基于人工智能的对话方法、装置、设备及存储介质
CN115374360A (zh) 媒体资源的召回方法和媒体资源召回模型的训练方法
CN117196031A (zh) 一种构建客户需求认知体系的方法和系统
CN117033757A (zh) 信息选取方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination