CN113590936B - 信息推送的方法及装置 - Google Patents
信息推送的方法及装置 Download PDFInfo
- Publication number
- CN113590936B CN113590936B CN202110753151.4A CN202110753151A CN113590936B CN 113590936 B CN113590936 B CN 113590936B CN 202110753151 A CN202110753151 A CN 202110753151A CN 113590936 B CN113590936 B CN 113590936B
- Authority
- CN
- China
- Prior art keywords
- intention
- feature
- information
- user
- categories
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012098 association analyses Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 65
- 238000010276 construction Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 7
- 238000010219 correlation analysis Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000012216 screening Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 79
- 230000008569 process Effects 0.000 description 12
- 230000036541 health Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011478 gradient descent method Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 238000012097 association analysis method Methods 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 235000021185 dessert Nutrition 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0259—Targeted advertisements based on store location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供一种信息推送的方法,通过获取基于第一用户的当前状态信息,然后基于当前状态信息提取第一用户的多个业务特征,接着,检测预先构建的意图网格中,与第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间的对应关系,意图网格基于对各个特征组合与意图类别进行关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别,进一步根据检测结果,向所述第一用户进行信息推送。该实施方式使得信息推送更加精准有效。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及信息推送的方法及装置。
背景技术
随着计算机技术、移动终端和互联网等的发展,终端应用越来越普及。由此为人们的生活、学习和工作带来各种各样的便利。为了给人们带来更加便捷的生活,根据人们的需求进行信息推送,是终端应用常用的技术手段。所谓信息推送,就是主动向用户提供某些可能需要的信息,从而减少用户主动搜索耗费的时间和精力。
常规的信息推送,通常根据用户当前的状态,以及用户偏好等,提取用户特征,并根据用户特征通过预测模型确定用户与各种候选推送信息之间的关联程度,从而向用户确定排列靠前的多条候选推送信息进行信息推送。
本说明书为了更加准确地进行信息推送,并提供更加具有场景普适性的解决方案,提出一种基于意图网格的信息推送方案。
发明内容
本说明书一个或多个实施例描述了一种信息推送的方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种信息推送的方法,包括:获取基于第一用户的当前状态信息;基于所述当前状态信息提取所述第一用户的多个业务特征;从预先构建的意图网格中,检测与所述第一用户的多个业务特征相匹配的特征组合,其中,所述意图网格用于描述预定特征组合与意图类别之间的对应关系,意图网格基于对各个特征组合与多个意图类别之间的关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别;根据检测结果,向所述第一用户进行信息推送。
在一个实施例中,所述当前状态信息包括,身份状态信息、位置状态信息、运动状态信息、时间信息以及历史业务状态信息中的一项或多项。
在一个实施例中,所述意图网格通过以下方式构建:对s个业务特征进行组合,形成m个特征组合,单个特征组合包含s个业务特征中的若干个;对各个特征组合,分别统计其在样本集中和预定的p个意图类别之间具有的对应关系,以根据所述对应关系进行关联性分析;根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。
在一个实施例中,所述根据所述对应关系进行关联性分析包括:将m个特征组合和p个意图类别分别映射到q维空间,得到在q维空间的m+p个点,q小于等于3;根据m个特征组合一一对应的m个点各自与p个意图类别一一对应的p个点在q维空间的欧氏距离,确定m个特征组合各自与p个意图类别的关联强度。
在一个实施例中,将m个特征组合和p个意图类别分别映射到q维空间,得到在 q维空间的m+p个点包括:根据m个特征组合分别和p个意图类别之间的对应关系,构建m*p维的关联矩阵,其中,所述关联矩阵中,单个行对应单个特征组合,单个列对应意图类别,在单个特征组合对应有单个意图类别的情况下,相应的行、列交汇处的元素值表示其对应关系;对所述关联矩阵通过奇异值分解,拆分为第一矩阵、奇异值矩阵和第二矩阵的乘积,所述奇异值矩阵的对角元素为所述关联矩阵对应的多个奇异值,各个奇异值从左向右由大到小排列;将所述第一矩阵各行的前q维作为相应特征组合在q维空间的坐标,同时将所述第二矩阵各列的前q维作为相应意图类别在q 维空间的坐标,从而得到m个特征组合和p个意图类别分别对应的各个点。
在一个实施例中,所述s个业务特征通过以下特征重要度分析方式从n1个候选特征中筛选:针对n1个候选特征和n2个业务标签,分别在N维样本空间中表示,得到N 维样本空间中的n1+n2个点,其中,N维样本空间的N个维度与N个样本一一对应,单个候选特征或业务标签在样本空间各个维度的值,为相应样本在该单个候选特征上的特征值或业务标签的标签值;在N维样本空间,通过由欧氏距离转化的第一高斯概率来表示n1+n2个点两两之间的相似性;在低维空间,利用n1+n2个点分别表示n1个候选特征和n2个业务标签,并通过欧氏距离转化的第二高斯概率来表示n1+n2个点两两之间的相似性;以相同的两个点对应的第一高斯概率与第二高斯概率的分布一致性为目标,调整低维空间的n1+n2个点的坐标值,从而确定n1个候选特征和n2个业务标签各自在低维空间表示的点坐标;针对单个业务标签,利用其在低维空间表示的点分别与n1个候选特征在低维空间表示的点的距离比较,选择在低维空间距离与该单个业务标签最近的s个候选特征。
在一个实施例中,所述根据检测结果,向所述第一用户进行信息推送包括:在检测到与所述第一用户的多个业务特征相匹配的特征组合有且仅有第一特征组合的情况下,根据第一特征组合对应的若干个意图类别确定目标意图进行信息推送。
在一个实施例中,单个特征组合和单个意图类别对应有关联强度;所述根据检测结果,向所述第一用户进行信息推送包括:在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合分别与各个意图类别对应的各个关联强度中的最大关联强度对应的意图类别确定目标意图进行信息推送。
在一个实施例中,所述根据检测结果,向所述第一用户进行信息推送包括:在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合对应的意图类别中出现频次最高的意图类别确定目标意图进行信息推送。
在一个实施例中,在目标意图与地理位置相关的情况下,通过以下方式根据目标意图进行信息推送:获取目标意图下各条候选推送信息分别对应的位置信息;根据各条候选推送信息的位置信息,确定距离所述第一用户当前位置最近的候选推送信息,并将其推送给所述第一用户。
根据第二方面,提供一种信息推送的装置,包括:
获取单元,配置为获取基于第一用户的当前状态信息;
提取单元,配置为基于所述当前状态信息提取所述第一用户的多个业务特征;
检测单元,配置为从预先构建的意图网格中,检测与所述第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间的对应关系,所述意图网格基于对各个特征组合与多个意图类别之间的关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别;
推送单元,配置为根据检测结果,确定所述第一用户的向所述第一用户进行信息推送。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,通过对样本集中特征组合和意图类别之间的关联性分析,挖掘特征和意图之间的关联性,从而预先构建意图网格。这种方式有助于针对当前用户,挖掘强相关的意图类别,从而提高信息推送的准确性。在意图网格构建过程中,考虑样本集中的意图频次的情况下,可以更有效地按照特征组合进行群体分析,使得信息推送更加精准有效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书技术构思下的一个具体实施架构示意图;
图2示出根据一个具体例子的三维意图网格示意图;
图3示出根据一个实施例的意图网格构建流程图;
图4示出根据一个具体例子的意图网格构建过程中特征组合和意图类别在低维空间的投影示意图;
图5示出根据一个实施例的信息推送的方法的流程图;
图6示出根据一个实施例的信息推送的装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
首先,结合图1示出的一个具体实施场景进行说明。如图1所示,该具体实施场景可以包括,用户终端和服务端。其中,用户终端可以安装并运行各种终端应用。例如信息推送类应用、新闻类应用、购物类应用、外卖平台应用等等。服务端可以为终端应用提供服务,例如为信息推送类应用提供服务等。
服务端可以在本地设置有计算平台,或者连接其他设备上的计算平台。其他设备可以通过具有一定计算能力的计算机、服务器等实现。本说明书的实施场景为信息推送的场景。终端应用可以通过用户持有的用户终端采集用户状态信息。例如用户位置状态信息、用户运动状态信息、行为状态信息、用户消费习惯信息等等。这些用户状态信息可以通过终端应用上传至服务端,服务端通过计算平台,从用户状态中采集用户特征。终端应用也可以直接从这些用户状态信息中提取用户特征并上传至服务端。从而,服务端可以根据用户特征,得到相匹配的待推送信息,发送至用户终端。
例如,图1示出的实施架构下,一个具体例子中推送信息为“通知:打开健康码页面”。此时的场景例如为用户抵达医院并需要进入医院。用户状态可以包括用户由高速运动(如乘车)转为低速运动(如下车步行或停止),表明到达其目标地点,并通过定位确定用户在某医院门口附近(允许一定误差,或用户提前操作)。在一个实施例中,在经过授权的情况下,该通知还可以通过“健康码”小程序的主界面代替。这里,健康码例如是在特殊传染性疾病流行期间,标记用户是否去过存在确诊病例的高风险区域的二维码。具体实施时,服务端提供服务的终端应用可以是各种可以进行信息推送的终端应用。例如,在一个实施例中,该终端应用为本地生活服务类应用,服务端可以根据用户状态为用户推送本地优惠券等。在另一个实施例中,该终端应用为购物类应用,服务端可以根据用户状态为用户推送商品或服务等。
在本说明书的实施架构下,为了提供更加精准、应用场景更加丰富的信息推送,可以利用预先构建的意图网格,结合用户特征进行目标意图推断。意图网格可以理解为一种描述用户意图和业务特征之间对应关系的图表。其可以是表格形式,也可以是可视化展示的图的形式。图2给出了一个意图网格的具体示例。在该具体示例中,意图网格通过将高维数据表示在低维空间,从而进行可视化展示。图2示出的意图网格为三维空间,每个立体小方格代表了一种意图类别对应的空间,各种业务特征通过坐标轴表示。例如三个坐标轴分别表示位置、时间、身份等。位置可以包括工作地、家、常住城市、非常驻城市、地标(商圈、医院等)等等,时间可以包括早、中、晚、工作日、节假日、节气、特殊节日(如母亲节等),还可以包括春夏秋冬各个季节等等,身份可以包括性别、职位类别、年龄等描述用户的社会属性的特征,以及其行动状态 (如乘车高速出行、步行低速行走等)。在使用时,可以根据用户状态信息提取用户特征,并映射到意图网格。根据映射到的区域(如图2中的某个小立方体),确定用户意图,从而进行信息推送。如图2所示,在工作日早高峰,为地铁站的任意性别用户推送出行券和/或早餐券等信息,而在周末下午,为处于商场的女性推送商场优惠券、电影券等信息。
为了明确本说明书的技术构思,先描述意图网格的构建过程。
如图3所示,是一个意图网格的构建流程示意图。该流程可以包括以下步骤:步骤301,利用样本集中的各条业务数据,进行特征重要度分析,以从多个候选特征中选择出s个业务特征;步骤302,对选定的s个业务特征进行组合,形成m个特征组合,单个特征组合包含s个业务特征中的若干个;步骤303,对各个特征组合,分别统计其在样本集中和预定的p个意图类别之间具有的对应关系,以根据所述对应关系进行关联性分析;步骤304,根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。
首先,在步骤301中,利用样本集中的各条业务数据进行特征重要度分析,以从多个候选特征中选择出s个业务特征。
可以理解,业务数据可以是用于描述业务或者用户信息的数据。业务数据的具体内容可以与具体业务场景相关。例如,在优惠券推送业务场景下,业务数据可以包括用户当前位置、用户消费习惯、用户身份信息、用户历史消费记录、消费偏好、优惠券信息等等。在一个实施例中,一条业务信息例如可以对应一个用户,在另一个实施例中,一条业务信息可以对应一个优惠券(包括其推送的用户及用户对其处理过程)。在其他业务场景下,业务数据还可以是其他数据,例如新闻推送场景下,用户的浏览信息、浏览习惯(如进地铁站开始浏览新闻)等等。在更多业务场景下,业务数据还可以包括更多信息,在此不再一一赘述。
其中,候选特征可以是表征相应业务场景下的业务或用户特点的数据项。候选特征可以是预先设定的数据项。例如在优惠券推送业务场景下,可以将业务数据中的各种数据项都设置对应的候选特征,例如用户当前位置可以对应位置是否商圈/地铁站/ 医院等地标位置、是否常住城市等候选特征,用户消费习惯可以对应消费频次、支付习惯等等候选特征,用户身份信息可以对应年龄、性别、职业等等候选特征,用户历史消费记录可以对应消费金额、购买商品或服务的类别等等候选特征,消费偏好可以对应消费场所、购物风格、食品消费类别及口味等等候选特征,优惠券信息可以对应优惠券面值、优惠券使用条件、优惠券对应的商品/服务类别等等候选特征,等等。
候选特征可以人为设定,也可以通过语义分析确定,在此不做限定。通常,候选特征所涉及的范围可以是宽泛的。可选地,对于一些明显无效的特征,也可以在确定候选特征时优先排除。例如信息推送场景下的设备已使用年限特征等。
业务特征可以是从候选特征中选出的重要特征。所谓重要特征,可以是对推送信息的业务结果具有重要影响的特征。通常,信息推送的结果是可以评价的。例如用户接受或者不接受。在优惠券推送场景下,信息推送结果可以通过优惠券是否核销进行评价。在其他信息推送场景下可以通过其他方式评价信息推送结果,例如新闻推送场景下通过是否点击并浏览,商品推送场景下通过用户是否通过推送链接购买商品来评价信息推送结果。那么推送结果是否成功,可能由哪些因素决定,就对应了重要特征。
重要特征的选择可以通过人工经验确定,也可以通过机器学习模型选择。以机器学习模型选择为例,本说明书可以采用降维的方式选择重要特征。这种方式的构思建立在在低维空间表示各个特征与各个标签(label)之间关系的基础上进行。为了描述方便,假设候选特征为n1个和业务标签为n2个。在只有一个业务标签(如优惠券是否核销)的情况下,n2=1。
首先,将一个批次的N条业务数据按照候选特征提取特征值,并确定其标签(例如是否核销优惠券等)。对于单个候选特征来说,可以通过各条业务数据中的特征值构成的向量来表示。换句话说,将N条业务数据看作N维空间,例如称为N维样本空间,对于单个特征xi来说,各条业务数据中的特征值构成的N维向量可以表示该特征。同理,标签也可以用各条业务数据中的标签值构成的N维向量表示。则各个候选特征和业务标签,共n1+n2个元素均可以通过N维向量表示,例如记为:x1、x2…… xn1……xn1+n2。可以理解,对于高维的点,可以通过将欧氏距离转化为条件概率来表征点与点之间的相似性。假设pj|i为以点xi为中心,以高斯分布选择xj作为近邻点的条件概率,则有:
其中,该公式(1)中,将以高斯分布选择点xn1+n2作为xi近邻点的概率之和作为分母进行归一化,默认pi|i=0。同时也可以看出,不同数据点xi可以对应不同的σi。
进一步地,可以在可视的低维空间中描述这n1+n2个元素。通常,降维后的维度表示可以是1维、2维、3维。假设在低维空间,x1、x2……xn……xn1+n2分别被映射为点y1、y2……yn……yn1+n2。其中,yi对应着低维向量,如2维向量。假设qj|i为以点 yi为中心,以高斯分布选择yj作为近邻点的条件概率,则有:
可以看到,qj|i的表达式里面没有方差,这是因为我们的目标是用低维分布去拟合高维分布,而不是让两者完全一样。方差的大小仅对图案进行缩放,因此,在低维空间无需考虑。
为了用低维分布去拟合高维分布,可以用相对熵来衡量低维分布和高维分布之间的一致性。相对熵即KL距离,也叫KL散度。根据相对熵的定义,可以确定高维分布和低维分布之间的损失:
其中,Pi=pj|i,Qi=qj|i,分别可以看作分布矩阵P和Q中与xi、yi对应的两个分布行或列。
进一步地,可以通过梯度下降等方法,调整yi的坐标,从而得到低维表示。以低维空间为2维空间为例,梯度例如可以表示为:
接着,可以利用梯度下降法之类的方法更新各个yi。本领域技术人员容易知道梯度下降法的更新过程,在此不再赘述。在一个具体例子中,为了避免yi在局部最小处收敛,可以采用带动量的梯度下降法。也就是说,在梯度下降法更新参数过程中,增加一个动量项,使得梯度下降到某一个局部最小点时可以快速摆脱,从而继续爬坡寻找全局最小值。例如yi按照公式(5)更新:
如此,经过多个批次的样本,进行相应周期迭代进行参数更新,直至yi收敛,可以确定各个yi,即各个候选特征及业务标签在低维空间的表征。其中,在初始的迭代周期,t-1和t-2时刻的yi可能不存在,此时,可以使用单纯的梯度下降法更新,至若干个迭代周期(如3个、10个)后,开始采用公式(5)的方法更新。
假设最终调整参数后,最终得到各个候选特征的低维表示y1'、y2'……yn',业务标签的低维表示yn+1'……yn1+n2',利用yi的各个维度分别作为低维空间中的坐标值,从而将各个特征及标签映射到低维空间。在低维空间,与业务标签对应的点距离越近的点,相应候选特征对于标签来说可能越重要。因此,可以利用欧氏距离等,针对单个业务标签,例如yn+1',选择与其距离最近的s个点,将相应特征作为针对该单个业务标签的业务特征。其中,s个点可以是与单个业务标签对应的点距离小于预定阈值的点,也可以根据与单个业务标签对应的点的距离由小到大的顺序选择排列靠前的点。选出的业务特征例如可以记作x1'、x2'……xs'。
接着,通过步骤302,对s个业务特征进行组合,形成m个特征组合。本领域技术人员可以理解,该步骤302的目的是为了将多个维度合并,从而能够在可视化的低维空间里表示各个样本。
其中,m个特征组合通过从s个业务特征中选择若干个特征确定。例如,分别选择2、3、4个业务特征。在m个特征组合是s个业务特征的所有组合的情况下,这种组合可能有2s-1个。实践中,还可以在各种特征组合下的不同特征值进行区分。换句话说,在第一特征a和第二特征b构成特征组合的情况下,假设第一特征和第二特征的特征值均可以为0和1两种情形,则第一特征和第二特征构成的特征组合至多有4 个,分别包括以下(a,b)对应的四种情形:(0,0),(0,1),(1,0),(1, 1)。
进一步地,通过步骤303,对各个特征组合,分别统计其在样本集中和预定的p 个意图类别之间的对应关系,以根据该对应关系进行关联性分析。其中,意图类别可以表示用户的目的或想做的事情,例如房产意图、购物意图、餐饮意图等。
如表1所示,为统一选择4个业务特征进行组合(此时组合数如为Cs 4)的一个统计结果的部分示意图。
这里,各行对应一个特征组合,各列对应一个意图,或称为一个类别的候选推送信息。例如第一行,特征组合包括:性别女,年龄特征55-59岁,用餐时间特征为晚餐时间,对应服务特征为购物服务。然后,经过样本集中的业务数据统计,确定该特征组合在样本集中和预定的p个意图类别之间的对应关系。在一个实施例中,表1中的1表示该特征组合下对应到相应意图类别下的样本数为至少一条,即,只要该特征组合下出现过该意图类别(不论多少条样本数据),相应位置为1,否则为0。在另一个实施例中,表1中的1表示该特征组合下对应到相应意图类别下的样本数为1条,例如对应这个特征组合的业务数据条数分别为:房产意图1条,打开健康码意图1条, AR识别意图1条,医疗健康意图1条,依次类推。
在一个可能的设计中,可以利用步骤301中确定的各个业务特征在低维空间中的表示确定其相关性。例如,对于s个业务特征对应的点x1'、x2'……xs',将欧式距离小于预定阈值的若干个业务特征确定为相关联的特征。
在另一个可能的设计中,可以通过关联分析法(Association Analysis),以样本集中的业务数据为依据,对各个业务特征进行多元相依的统计分析,确定业务特征与意图类别之间的关联关系。
关联分析又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。或者说,关联分析是发现交易数据库中不同商品(数据项)之间的联系。
关联分析的思想是,如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。它的目的是为了挖掘隐藏在数据间的相互关系。在利用关联分析法时,可以先根据特征和候选推送信息,构建关联矩阵,例如,对于以上 m个特征组合中的单个特征组合,分别统计其与p个意图类别在样本集中的对应关系。如此可以得到关联矩阵Xmp,例如为:
根据关联分析法,在一个实施例中,可以找到包含该特征组合的业务数据条数在总的样本集中的比例作为支持度,进一步地,根据支持度发现组合规则。例如,支持度越高,说明特征组合中各个特征的关联度越高。从而可以选择支持度排列靠前的特征组合。
在另一个实施例中,为了更准确地对统计结果进行分析,可以采用奇异值分解的方式,表征特征组合和用户意图,从而确定特征组合和各种用户意图之间的关联关系。可以理解,奇异值分解(SVD)可以将关联矩阵分解为第一矩阵、奇异值矩阵、第二矩阵的乘积。其中,第一矩阵和第二矩阵为酉矩阵。第一矩阵的一行可以表征关联矩阵中的一个特征组合,第二矩阵的一列可以表征一个意图类别,而奇异值矩阵中对角线元素分别为关联矩阵的各个奇异值,且按照奇异值由大到小的顺序依次排列。这样一来,第一矩阵的一行,及第二矩阵的一列中,排列越靠前的元素,越能表征相应的特征组合或者意图类别。
作为一个具体示例,假设关联矩阵记为M,M例如是Xmp本身。则通过奇异值分解,例如得到M=ΓΛΔT。其中,Γ是MMT的特征向量构成的m×k维矩阵,每一行为一个特征向量,Δ是MTM的特征向量构成的k×p矩阵,每一列为一个特征向量,Λ=diag (λ1 1/2,λ2 1/2,...,λk 1/2),λ1 1/2-λk 1/2为M的由大到小排列的k个奇异值。矩阵 M中,第i行第j列的元素为:其中,γit为矩阵Γ中第i行第t 列的元素,δjt为矩阵Δ中第j行第t列的元素。
可选地,为了更好地进行奇异值分解,以上的M还可以是对Xmp进行归一化得到的矩阵。假设归一化后的矩阵为C,归一化过程例如为:其中:归一化参考量eij=xit*xtj/xtt;xit为Xmp中一行(对应一个特征组合)求和的结果的元素以及Δ中各列排列靠前的元素,具有更大的权重。因此,可以取其排列靠前的维度作为低维空间的坐标值,从而在低维空间表示相应的特征组合,或者意图类别。例如,取矩阵Γ中各行的前2维,作为2维坐标系中的坐标,表示相应行对应的特征组合,同样,取矩阵Δ中各列的前2维,作为2维坐标系中的坐标,表示相应列对应的意图类别(如房产、美容等)。事件中,还可以取1维、3维等。在一个实施例中,可以按照相邻奇异值的差别来确定选择多少维。例如,后一个奇异值(如第3个)比当前奇异值(如第2个) 减少50%以上时,取到当前维(如第2维)。如此,可以把高维的特征组合和意图类别在低维空间进行表征。
在低维空间,可以按照前文类似的方式,确定点与点之间的欧氏距离。欧氏距离较近的特征组合和意图类别之间,具有较强的相关性。
接着,在步骤304中,根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。意图网格可以是图表、图像或者其结合形式,也可以是文本形式,在此不做限定。其中,图表形式如表1所示。
此处如果通过距离阈值来检测和判断,则针对一个特征组合,可以将与其距离小于距离阈值的意图类别均确定为与其强相关的意图类别。如果通过数量来检测和判断,则针对一个特征组合,可以将与其距离最小的意图类别确定为与其强相关的意图类别。
如图4所示,是两两业务特征进行组合的情况下,在二维空间表征特征组合和意图类别的示意图。图4中示出的业务特征组合为城市级别(一线、二线等)与年龄相组合。在城市级别和年龄分别取不同值的情况下构成的多种特征组合,以及不同的意图类别(如餐饮正餐、休闲娱乐、理发、餐饮甜品等)映射到情况下,可以看出,特征组合“三线及以下_24及以下”与意图类别休闲娱乐距离较小,则两者强相关。同时,特征组合“三线及以下_24及以下”与意图类别“理发”、“丽人_美容”距离也较小,则它们之间也是强相关的。进一步地,可以将不是强相关的特征组合和意图类别之间解耦,例如特征组合“三线城市及以下_55-65”与意图类别“餐饮_甜品”、“商家代金券”、“理发”、“丽人_ 美容”、“休闲娱乐”等,距离都较远,则可以认为这种特征组合与这些意图类别无关。
如此,可以确定与各个特征组合关联强度最大的若干意图类别,进而用于构建意图网格。三维的意图网格可以参考图2所示的形式,在此不再赘述。
在可选的实现方式中,可以利用强相关的特征组合和意图类别更新意图网格。意图网格的形式可以在表1的基础上进行更新,例如在某个特征组合与某个意图类别无关的情况下,将相应行列交汇处的元素改为0。
在一个实施例中,还可以通过特征组合与意图类别之间的欧氏距离确定其匹配度。例如,特征组合A与意图类别B之间的欧氏距离为D,则A和B的匹配度r与D负相关,例如为1/D。该匹配度也可以作为在相应特征组合(如特征组合A)下选择相应意图类别 (如意图类别B)的置信度。
意图网格描述了特征组合和意图之间的关系。在一个可选的例子中,可以将一个特征组合相关的意图类别确定为在低维空间与该特征组合对应的点的欧氏距离最近的一个意图类别。这样,一个特征组合对应的意图类别就是唯一确定的。在另一个可选的例子中,可以将一个特征组合相关的意图类别确定为在低维空间与该特征组合对应的点的欧氏距离最近的多个意图类别。这样,一个特征组合可以对应多个可能的意图类别。
可以理解,在确定意图网格的过程中,步骤301也可以略去,例如通过人工确定若干个业务特征进入步骤302,在此不做限定。意图网格确定后,可以存储在服务端,也可以存储在与服务端连接的其他平台,在此不做限定。意图网格可以用于信息推送。
参考图5所示,示出了根据一个实施例的信息推送的流程。该流程的执行主体可以是任意具有一定计算能力的计算机、设备或服务器,例如图1所示的计算平台。如图5所示,信息推送的流程包括以下步骤:步骤501,获取第一用户的当前状态信息;步骤502,基于当前状态信息提取第一用户的多个业务特征;步骤503,从预先构建的意图网格中,检测与第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间具有的对应关系,意图网格基于对各个特征组合与意图类别之间的关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别;步骤504,根据检测结果,向第一用户进行信息推送。
步骤501,获取第一用户的当前状态信息。可以理解,第一用户可以是任意的终端用户,“第一”为泛指,并不对用户本身构成限定。
当前状态信息可以用于描述第一用户在当前的各种业务状态。其可以和当前业务场景相关。当前状态信息例如可以包括,身份状态信息、位置状态信息、运动状态信息,行为状态信息以及历史业务状态信息等等。身份状态例如可以包括性别、年龄、职业等等用户本身相关的信息。该类信息通常较稳定,也可以由服务端预先存储。位置状态信息例如可以包括,是否家的位置、是否公司位置、是否常驻城市、是否商圈/医院/地铁站等地标位置。运动状态信息例如可以包括,运动速度、运动方向、运动路线、运动状态变化等信息。历史业务状态信息例如可以包括,行为状态信息例如可以包括当前执行的操作(如浏览商品、无操作)等,历史业务活动中产生的业务信息、偏好信息、业务序列等等。在优惠券信息推送场景下,历史业务活动中产生的业务信息例如可以包括历史获得优惠券及其是否核销的行为信息等。
值得说明的是,在步骤501中,可以响应于第一用户的业务请求而获取其当前状态信息,也可以实时增量采集其当前状态信息,根据具体业务设置而定,在此不做限定。当前状态信息中的一些信息项可以通过用户终端的各种传感器采集,一些数据项可以通过终端应用采集。例如,运动状态信息可以通过用户终端内置的陀螺仪等采集,地理位置信息可以通过GPS定位系统等采集、设备连接网络(如WiFi名称)等定位,历史业务状态信息、身份状态信息等可以通过终端应用的使用日志、登记信息等获取。
接着,在步骤502中,基于当前状态信息提取第一用户的多个业务特征。其中,多个业务特征可以预先确定,例如图3的流程构建的意图网格过程中,所涉及的s个业务特征。
特征提取的过程就是从当前状态信息中确定业务特征的特征值的过程。例如,针对一个用户F提取到业务特征:年龄55,性别女,时间周末下午2点,地点商圈附近,运动速度由高速转为低速。
其中,特征提取过程可以由客户端(用户终端)完成,也可以由服务端完成,也可以由客户端和服务端联合完成。在由服务端完成的情况下,客户端可以将采集到的用户状态信息上传至服务端。在可选的实施例中,可以由服务端记录更新频率较低的业务特征(或称为稳定特征),如年龄、性别等,并从客户端获取更新频率较高的业务特征(或称为不稳定特征),如运动状态、当前位置等,或从由客户端获取更新频率较高的业务信息,从中提取相关业务特征。
接着,步骤503,从预先构建的意图网格中,检测与第一用户的多个业务特征相匹配的特征组合。其中,这里的意图网格用于描述预定特征组合与意图类别之间的对应关系,其可以通过图3的方式构建,在此不再赘述。
根据意图网格的特点,可以先将第一用户的业务特征与各个特征组合进行匹配。业务特征可以匹配到一个或多个特征组合。在匹配到多个特征组合的情况下,可以将多个特征组合对应的
例如一个特征组合为“年龄50-60,性别女,位置商圈”,为了描述方便以下称为特征组合E,另一个特征组合为“时间周末下午2点,地点商圈附近,运动速度由高速转为低速”,为了描述方便以下称为特征组合G。则前文的用户F的业务特征既可以匹配到特征组合E,又可以匹配到特征组合G。
进一步地,在步骤504中,根据检测结果,向第一用户进行信息推送。可以理解,在检测到相匹配的特征组合的情况下,可以根据检测到的特征组合对应的意图类别向第一用户推送信息。
一个意图类别可以对应一条或多条候选推送信息。例如在“午餐优惠券”意图类别下,可以对应多家饭店的优惠券作为候选推送信息。
可以理解,在第一用户的多个业务匹配到单个特征组合的情况下,可以将该单个特征组合对应的意图类别作为目标意图。
在第一用户的多个业务特征匹配到多个特征组合的情况下,从这多个特征组合对应的意图类别中选择一个或多个意图类别,作为第一用户的目标意图。进一步的,从这一个或多个意图类别中选择一个或多个候选推送信息进行信息推送。在一个可选的实施例中,还可以将这多个特征组合对应的意图类别下的所有候选推送信息放在一起,按照预定规则选择其中的一项或多项进行信息推送。
其中,在意图网格或者候选推送信息的可选项较多的情况下,使用上述的预定规则选择意图网格或者候选推送信息。例如,在意图网格中,意图类别具有置信度的情况下,选择意图类别的预定规则可以为:优先选择置信度较高的意图类别。而选择候选推送信息的预定规则例如可以为:在意图类别与地理位置有关的情况下,选择距离第一用户当前位置最近的至少一条候选推送信息,例如,推送距离第一用户当前位置最近的饭店的优惠券信息;在意图类别与时序有关的情况下,选择优先级更高的候选推送信息,例如,在检测到用户要进入医院时,先推送“健康码”,再推送医院内的停车场信息,而检测到用户要进入商场时,先推送商场的停车场信息,再推送“健康码”,等等。
在根据地理位置可以确认意图类别下的某一条候选推送信息的情况下,可以确定第一候选推送信息为该唯一确定的候选推送信息。在根据地理位置无法定位其中一家(如小吃街、美食城等同类型店铺密度较大)的情况下,可以按照预定规则选择一条或多条候选推送信息进行信息推送。在选择多条候选推送信息的情况下,第一候选推送信息可以为其中任意一条被选中的候选推送信息。
举例而言,在前文的例子中,特征组合E和特征组合G各自仅对应一个意图类别,分别为e、g,则可以随机选择一个意图类别e、g下的候选推送信息进行信息推送,也可以在两个意图类别e、g之间切换候选推送信息,进行滚动信息推送,还可以按照意图类别的置信度选择置信度更高的意图类别(如e),推送相关候选推送信息,等等。同理,对同一个意图类别候选推送信息的选择也可以按照这种方式进行。在另一个可选实施方式中,还可以将意图类别e、g下的所有候选推送信息放在一起进行选择。
根据一种可选的实现方式,在匹配到的多个特征组合各自对应的意图类别具有交集的情况下,还可以优先选择交集意图类别。例如,匹配到的特征组合E对应意图类别e、h,特征组合G对应意图类别g、h,则优先选择意图类别h,并从意图类别下选择相关的候选推送信息。
在第一用户的多个业务特征不能完全匹配到单个特征组合的情况下,例如总有一项或多项业务特征与特征组合中的特征项不一致,还可以通过以下几种方式选择候选推送信息进行信息推送:随机选择候选推送信息;从匹配特征项数最多的特征组合中随机选择意图类型;从第一用户的历史意图类型中选择候选推送信息;选择涉及的地理位置与第一用户当前位置最近的候选推送信息(如最近店铺的优惠券等);等等。
实践中,根据业务需求,还可以有各种其他合理的意图类别及候选推送信息的选择方式,在此不再一一赘述。
根据一个可能的设计,在匹配不到特征组合的情况下,可以不进行信息推送,即,采取推则求准、宁缺毋滥的原则,以免对用户造成困扰。
回顾以上过程,本说明书实施例提供的意图网格构建方法以及信息推送方法,业务特征与用户意图之间的关联性分析,构建特征组合和用户意图之间的意图网格。由于构建意图网格时,通过关联分析确定特征组合与意图类别的关联性,可以更准确地分析用户意图,提高信息推送的准确度。进一步地,关联分析过程中还考虑意图类别在全部样本集中出现的频次,从而可以考虑意图类别的重要程度,更精准地进行群体性分析,提升信息推送的效果。
根据另一方面的实施例,还提供一种信息推送的装置。该装置可以设于可以进行信息推送的各种终端应用的服务端,也可以部分设于终端,部分设于服务端。如图6所示,信息推送的装置600可以包括:
获取单元61,配置为获取基于第一用户的当前状态信息;
提取单元62,配置为基于当前状态信息提取第一用户的多个业务特征;
检测单元63,配置为从预先构建的意图网格中,检测与第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间的对应关系,意图网格基于对各个特征组合与多个意图类别之间的关联分析确定,单个特征组合对应与其关联性最强的一个或多个意图类别;
推送单元64,配置为根据检测结果,确定第一用户的向第一用户进行信息推送。
根据一个实施例,当前状态信息包括,身份状态信息、位置状态信息、运动状态信息、行为状态信息以及历史业务状态信息中的一项或多项。
根据一个实施例,装置600还可以包括意图网格构建单元(未示出),配置为通过以下方式构建意图网格:对s个业务特征进行组合,形成m个特征组合,单个特征组合包含若干个业务特征;对各个特征组合,分别统计其在样本集中和预定的p个意图类别之间具有的对应关系,以根据对应关系进行关联性分析;根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。
根据一个进一步的实施例,意图网格构建单元进一步配置为通过以下方式根据对应关系进行关联性分析:将m个特征组合和p个意图类别分别映射到q维空间,得到在q维空间的m+p个点,q小于等于3;根据m个特征组合一一对应的m个点各自与p个意图类别一一对应的p个点在q维空间的欧氏距离,确定m个特征组合各自与p个意图类别的关联强度。
根据一个更进一步的实施例,意图网格构建单元更进一步配置为:根据m个特征组合分别和p个意图类别之间的对应关系,构建m*p维的关联矩阵,其中,关联矩阵中,单个行对应单个特征组合,单个列对应意图类别,在单个特征组合对应有单个意图类别的情况下,相应的行、列交汇处的元素值表示其对应关系;对关联矩阵通过奇异值分解,拆分为第一矩阵、奇异值矩阵和第二矩阵的乘积,奇异值矩阵中的对角元素为关联矩阵对应的多个奇异值,各个奇异值从左向右由大到小排列;将第一矩阵各行的前q维作为相应特征组合在q维空间的坐标,将第二矩阵各列的前q维作为相应意图类别在q维空间的坐标,从而得到m个特征组合和p个意图类别分别对应的各个点。
根据一个实施例,推送单元64还配置为:
在检测到与第一用户的多个业务特征相匹配的特征组合有且仅有第一特征组合的情况下,根据第一特征组合对应的若干个意图类别确定目标意图进行信息推送。
根据一个实施例,单个特征组合和单个意图类别对应有关联强度;推送单元64还配置为:
在检测到与第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合分别与各个意图类别对应的各个关联强度中的最大关联强度对应的意图类别确定目标意图进行信息推送。
根据一个实施例,推送单元64还配置为:
在检测到与第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据匹配到的特征组合对应的意图类别中出现频次最高的意图类别确定目标意图进行信息推送。
根据一个进一步的实施例,在目标意图与地理位置相关的情况下,推送单元64还配置为通过以下方式根据目标意图进行信息推送:
获取目标意图下各条候选推送信息分别对应的位置信息;
根据各条候选推送信息的位置信息,确定距离第一用户当前位置最近的候选推送信息,并将其推送给第一用户。
值得说明的是,图6所示的装置600是与图5示出的方法实施例相对应的装置实施例,图5示出的方法实施例中的相应描述同样适用于装置600,在此不再赘述。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3或图5所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3或图5所描述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书的技术构思的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的技术构思的具体实施方式而已,并不用于限定本说明书的技术构思的保护范围,凡在本说明书实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的技术构思的保护范围之内。
Claims (19)
1.一种信息推送的方法,包括:
获取基于第一用户的当前状态信息;
基于所述当前状态信息提取所述第一用户的多个业务特征;
从预先构建的意图网格中,检测与所述第一用户的多个业务特征相匹配的特征组合,其中,所述意图网格用于描述预定特征组合与意图类别之间的对应关系,单个特征组合对应与其关联性最强的一个或多个意图类别,各个特征组合与多个意图类别之间的关联性通过以下方式确定:将m个特征组合和p个意图类别分别映射到q维空间,得到在q维空间的m+p个点,q小于等于3;根据m个特征组合一一对应的m个点各自与p个意图类别一一对应的p个点在q维空间的欧氏距离,确定m个特征组合各自与p个意图类别的关联强度;
根据检测结果,向所述第一用户进行信息推送。
2.根据权利要求1所述的方法,其中,所述当前状态信息包括,身份状态信息、位置状态信息、运动状态信息、时间信息以及历史业务状态信息中的一项或多项。
3.根据权利要求1所述的方法,其中,所述意图网格通过以下方式构建:
对选定的s个业务特征进行组合,形成m个特征组合,单个特征组合包含s个业务特征中的若干个;
对各个特征组合,分别统计其在样本集中和预定的p个意图类别之间具有的对应关系,以根据所述对应关系进行关联性分析;
根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。
4.根据权利要求1所述的方法,将m个特征组合和p个意图类别分别映射到q维空间,得到在q维空间的m+p个点包括:
根据m个特征组合分别和p个意图类别之间的对应关系,构建m×p维的关联矩阵,其中,所述关联矩阵中,单个行对应单个特征组合,单个列对应意图类别,在单个特征组合对应有单个意图类别的情况下,相应的行、列交汇处的元素值表示其对应关系;
对所述关联矩阵通过奇异值分解,拆分为第一矩阵、奇异值矩阵和第二矩阵的乘积,所述奇异值矩阵的对角元素为所述关联矩阵对应的多个奇异值,各个奇异值从左向右由大到小排列;
将所述第一矩阵各行的前q维作为相应特征组合在q维空间的坐标,同时将所述第二矩阵各列的前q维作为相应意图类别在q维空间的坐标,从而得到m个特征组合和p个意图类别分别对应的各个点。
5.根据权利要求3所述的方法,其中,所述s个业务特征通过以下的特征重要度分析方式从n1个候选特征中筛选:
针对n1个候选特征和n2个业务标签,分别在N维样本空间中表示,得到N维样本空间中的n1+ n2个点,其中,N维样本空间的N个维度与N个样本一一对应,单个候选特征或业务标签在样本空间各个维度的值,为相应样本在该单个候选特征上的特征值或业务标签的标签值;
在N维样本空间,通过由欧氏距离转化的第一高斯概率来表示n1+ n2个点两两之间的相似性;
在低维空间,利用n1+ n2个点分别表示n1个候选特征和n2个业务标签,并通过欧氏距离转化的第二高斯概率来表示n1+ n2个点两两之间的相似性;
以相同的两个点对应的第一高斯概率与第二高斯概率的分布一致性为目标,调整低维空间的n1+ n2个点的坐标值,从而确定n1个候选特征和n2个业务标签各自在低维空间表示的点坐标;
针对单个业务标签,利用其在低维空间表示的点分别与n1个候选特征在低维空间表示的点的距离比较,选择在低维空间距离与该单个业务标签最近的s个候选特征。
6.根据权利要求1所述的方法,其中,所述根据检测结果,向所述第一用户进行信息推送包括:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有且仅有第一特征组合的情况下,根据第一特征组合对应的若干个意图类别确定目标意图进行信息推送。
7.根据权利要求1所述的方法,其中,单个特征组合和单个意图类别对应有关联强度;
所述根据检测结果,向所述第一用户进行信息推送包括:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合分别与各个意图类别对应的各个关联强度中的最大关联强度对应的意图类别确定目标意图进行信息推送。
8.根据权利要求1所述的方法,其中,所述根据检测结果,向所述第一用户进行信息推送包括:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合对应的意图类别中出现频次最高的意图类别确定目标意图进行信息推送。
9.根据权利要求6-8中任一所述的方法,在目标意图与地理位置相关的情况下,通过以下方式根据目标意图进行信息推送:
获取目标意图下各条候选推送信息分别对应的位置信息;
根据各条候选推送信息的位置信息,确定距离所述第一用户当前位置最近的候选推送信息,并将其推送给所述第一用户。
10.一种信息推送的装置,包括:
获取单元,配置为获取基于第一用户的当前状态信息;
提取单元,配置为基于所述当前状态信息提取所述第一用户的多个业务特征;
检测单元,配置为从预先构建的意图网格中,检测与所述第一用户的多个业务特征相匹配的特征组合,其中,意图网格用于描述预定特征组合与意图类别之间的对应关系,单个特征组合对应与其关联性最强的一个或多个意图类别,所述意图网格基于对各个特征组合与多个意图类别之间的关联性通过以下方式确定:将m个特征组合和p个意图类别分别映射到q维空间,得到在q维空间的m+p个点,q小于等于3;根据m个特征组合一一对应的m个点各自与p个意图类别一一对应的p个点在q维空间的欧氏距离,确定m个特征组合各自与p个意图类别的关联强度;
推送单元,配置为根据检测结果,确定所述第一用户的向所述第一用户进行信息推送。
11.根据权利要求10所述的装置,其中,所述当前状态信息包括,身份状态信息、位置状态信息、运动状态信息、行为状态信息以及历史业务状态信息中的一项或多项。
12.根据权利要求10所述的装置,其中,所述装置还包括意图网格构建单元,配置为通过以下方式构建所述意图网格:
对s个业务特征进行组合,形成m个特征组合,单个特征组合包含若干个业务特征;
对各个特征组合,分别统计其在样本集中和预定的p个意图类别之间具有的对应关系,以根据所述对应关系进行关联性分析;
根据关联性分析结果,针对各个特征组合,逐一确定与其关联强度最大的若干意图类别,从而构建意图网格。
13.根据权利要求10所述的装置,所述意图网格构建单元更进一步配置为:
根据m个特征组合分别和p个意图类别之间的对应关系,构建m×p维的关联矩阵,其中,所述关联矩阵中,单个行对应单个特征组合,单个列对应意图类别,在单个特征组合对应有单个意图类别的情况下,相应的行、列交汇处的元素值表示其对应关系;
对所述关联矩阵通过奇异值分解,拆分为第一矩阵、奇异值矩阵和第二矩阵的乘积,所述奇异值矩阵中的对角元素为所述关联矩阵对应的多个奇异值,各个奇异值从左向右由大到小排列;
将所述第一矩阵相应各行的前q维作为相应特征组合在q维空间的坐标,同时将所述第二矩阵各列的前q维作为相应意图类别在q维空间的坐标,从而得到m个特征组合和p个意图类别分别对应的各个点。
14.根据权利要求10所述的装置,其中,所述推送单元还配置为:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有且仅有第一特征组合的情况下,根据第一特征组合对应的若干个意图类别确定目标意图进行信息推送。
15.根据权利要求12所述的装置,其中,单个特征组合和单个意图类别对应有关联强度;
所述推送单元还配置为:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合分别与各个意图类别对应的各个关联强度中的最大关联强度对应的意图类别确定目标意图进行信息推送。
16.根据权利要求10所述的装置,其中,所述推送单元还配置为:
在检测到与所述第一用户的多个业务特征相匹配的特征组合有多个的情况下,根据所匹配到的多个特征组合对应的意图类别中出现频次最高的意图类别确定目标意图进行信息推送。
17.根据权利要求14-16中任一所述的装置,在目标意图与地理位置相关的情况下,所述推送单元还配置为通过以下方式根据目标意图进行信息推送:
获取目标意图下各条候选推送信息分别对应的位置信息;
根据各条候选推送信息的位置信息,确定距离所述第一用户当前位置最近的候选推送信息,并将其推送给所述第一用户。
18.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。
19.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110753151.4A CN113590936B (zh) | 2021-07-02 | 2021-07-02 | 信息推送的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110753151.4A CN113590936B (zh) | 2021-07-02 | 2021-07-02 | 信息推送的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113590936A CN113590936A (zh) | 2021-11-02 |
CN113590936B true CN113590936B (zh) | 2023-11-14 |
Family
ID=78245776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110753151.4A Active CN113590936B (zh) | 2021-07-02 | 2021-07-02 | 信息推送的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113590936B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114357235B (zh) * | 2021-12-30 | 2023-05-16 | 广州小鹏汽车科技有限公司 | 交互方法、服务器、终端设备和存储介质 |
CN114549143B (zh) * | 2022-03-18 | 2022-07-29 | 电子科技大学 | 线下停车记录与线上购买行为融合的个性化商品推荐方法 |
CN116401567B (zh) * | 2023-06-02 | 2023-09-08 | 支付宝(杭州)信息技术有限公司 | 一种聚类模型训练、用户聚类、信息推送方法及装置 |
CN116384473B (zh) * | 2023-06-02 | 2023-08-08 | 支付宝(杭州)信息技术有限公司 | 一种计算图改进、信息推送方法及装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160119740A (ko) * | 2016-09-30 | 2016-10-14 | 에스케이플래닛 주식회사 | 사용자 의도에 따른 지능형 정보 제공 시스템, 방법 및 그에 대한 기록매체 |
CN106156062A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 确定用户的个性化标签、及推送信息的方法和装置 |
WO2017024684A1 (zh) * | 2015-08-07 | 2017-02-16 | 百度在线网络技术(北京)有限公司 | 用户行为意图的获取方法、装置、设备及非易失性计算机存储介质 |
CN106934007A (zh) * | 2017-02-14 | 2017-07-07 | 北京时间股份有限公司 | 关联信息的推送方法及装置 |
CN107832414A (zh) * | 2017-11-07 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN108153901A (zh) * | 2018-01-16 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于知识图谱的信息推送方法和装置 |
CN110035111A (zh) * | 2019-01-15 | 2019-07-19 | 加拿大辉莱广告公司 | 一种可配送实体的推送方法以及装置 |
CN110049079A (zh) * | 2018-01-16 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 信息推送及模型训练方法、装置、设备及存储介质 |
CN110311950A (zh) * | 2019-05-21 | 2019-10-08 | 平安科技(深圳)有限公司 | 信息推送方法、装置、设备和计算机可读存储介质 |
CN110909137A (zh) * | 2019-10-12 | 2020-03-24 | 平安科技(深圳)有限公司 | 基于人机交互的信息推送方法、装置和计算机设备 |
CN112182046A (zh) * | 2019-07-05 | 2021-01-05 | 北京猎户星空科技有限公司 | 一种信息推荐方法、装置、设备及介质 |
CN112995248A (zh) * | 2019-12-12 | 2021-06-18 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及设备 |
-
2021
- 2021-07-02 CN CN202110753151.4A patent/CN113590936B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156062A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 确定用户的个性化标签、及推送信息的方法和装置 |
WO2017024684A1 (zh) * | 2015-08-07 | 2017-02-16 | 百度在线网络技术(北京)有限公司 | 用户行为意图的获取方法、装置、设备及非易失性计算机存储介质 |
KR20160119740A (ko) * | 2016-09-30 | 2016-10-14 | 에스케이플래닛 주식회사 | 사용자 의도에 따른 지능형 정보 제공 시스템, 방법 및 그에 대한 기록매체 |
CN106934007A (zh) * | 2017-02-14 | 2017-07-07 | 北京时间股份有限公司 | 关联信息的推送方法及装置 |
CN107832414A (zh) * | 2017-11-07 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN108153901A (zh) * | 2018-01-16 | 2018-06-12 | 北京百度网讯科技有限公司 | 基于知识图谱的信息推送方法和装置 |
CN110049079A (zh) * | 2018-01-16 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 信息推送及模型训练方法、装置、设备及存储介质 |
CN110035111A (zh) * | 2019-01-15 | 2019-07-19 | 加拿大辉莱广告公司 | 一种可配送实体的推送方法以及装置 |
CN110311950A (zh) * | 2019-05-21 | 2019-10-08 | 平安科技(深圳)有限公司 | 信息推送方法、装置、设备和计算机可读存储介质 |
CN112182046A (zh) * | 2019-07-05 | 2021-01-05 | 北京猎户星空科技有限公司 | 一种信息推荐方法、装置、设备及介质 |
CN110909137A (zh) * | 2019-10-12 | 2020-03-24 | 平安科技(深圳)有限公司 | 基于人机交互的信息推送方法、装置和计算机设备 |
CN112995248A (zh) * | 2019-12-12 | 2021-06-18 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及设备 |
Non-Patent Citations (1)
Title |
---|
基于张量分解的多维信息融合兴趣点推荐算法;杨晓蕾;李胜;何熊熊;刘桂云;;小型微型计算机系统(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113590936A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113590936B (zh) | 信息推送的方法及装置 | |
Cui et al. | Personalized travel route recommendation using collaborative filtering based on GPS trajectories | |
US20220156252A1 (en) | System and method for data collection to validate location data | |
CN108875007B (zh) | 兴趣点的确定方法和装置、存储介质、电子装置 | |
EP3241370B1 (en) | Analyzing semantic places and related data from a plurality of location data reports | |
Lv et al. | The discovery of personally semantic places based on trajectory data mining | |
US10102564B2 (en) | System for adjusting map navigation path in retail store and method of using same | |
Brilhante et al. | On planning sightseeing tours with TripBuilder | |
US9123259B2 (en) | Discovering functional groups of an area | |
CN105532030B (zh) | 用于分析目标实体的移动的装置、系统和方法 | |
US20190220471A1 (en) | Methods and Systems for Interacting with Mobile Device | |
KR101810169B1 (ko) | 유동인구 패턴정보 기반의 미래입점객수 예측방법 및 장치 | |
US20170068982A1 (en) | Personalized contextual coupon engine | |
WO2016206196A1 (zh) | 用于获取用户属性信息的方法、装置及服务器 | |
US20210160653A1 (en) | System and method for accurately and efficiently generating ambient point-of-interest recommendations | |
JP6725718B2 (ja) | 位置基盤情報探索方法およびコンピュータ装置 | |
Zhang et al. | Beyond the limits of predictability in human mobility prediction: context-transition predictability | |
US12002052B2 (en) | Feature subspace isolation and disentanglement in merchant embeddings | |
US20200387988A1 (en) | Magellan: a context-aware itinerary recommendation system built only using card-transaction data | |
Liu et al. | Inferring gender and age of customers in shopping malls via indoor positioning data | |
KR20220119875A (ko) | 위치 정보 및 카드 거래 정보를 기반으로 사용자의 유형분류 및 서비스추천 장치 및 방법 | |
Sun et al. | Predicting future locations with semantic trajectories | |
Li et al. | Indoor mobility semantics annotation using coupled conditional Markov networks | |
Mao et al. | Utilizing multi-source data in popularity prediction for shop-type recommendation | |
Gao et al. | Semantic trajectory segmentation based on change-point detection and ontology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |