CN109767292A - 一种买家公司推荐方法 - Google Patents
一种买家公司推荐方法 Download PDFInfo
- Publication number
- CN109767292A CN109767292A CN201811591746.9A CN201811591746A CN109767292A CN 109767292 A CN109767292 A CN 109767292A CN 201811591746 A CN201811591746 A CN 201811591746A CN 109767292 A CN109767292 A CN 109767292A
- Authority
- CN
- China
- Prior art keywords
- seller
- company
- buyer
- buyer company
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种买家公司推荐方法,本算法通过短语匹配算法进行初步买家公司召回,并在召回的买家公司候选集通过机器学习进行创建率预估,最后使用创建率作进一步排序和筛选的依据,呈现最终的买家公司推荐展示结果。通过上述算法,其结果可以给卖家公司推荐潜在买家,方便卖家参考;通过召回过程中的多级弱化,保证了召回的候选买家公司数量满足卖家需求,避免因召回规则过于严格而无法形成足够召回量的情形;机器学习模型的特征除了文本相似度外还采取卖家的历史创建行为和买卖双方的交互行为数据,构建多维度特征,提升买家推荐的准确率和参考性,以提升平台推荐的转化率和买卖双方的成交率。
Description
技术领域
本发明涉及搜索匹配领域,特别是指一种买家公司推荐方法。
背景技术
跨境电子商务是指分属不同关境的交易主体,通过电子商务平台达成交易、进行支付结算,并通过跨境物流送达商品、完成交易的一种国际商业活动。跨境电子商务作为推动经济一体化、贸易全球化的技术基础,具有非常重要的战略意义。跨境电子商务不仅冲破了国家间的障碍,使国际贸易走向无国界贸易,同时它也正在引起世界经济贸易的巨大变革。对企业来说,跨境电子商务构建的开放、多维、立体的多边经贸合作模式,极大地拓宽了进入国际市场的路径,大大促进了多边资源的优化配置与企业间的互利共赢;对于消费者来说,跨境电子商务使他们非常容易地获取其他国家的信息并买到物美价廉的商品。
跨境电商平台上,企业的数量海量增长,如何更有效率地寻找潜在买家,确保成交率,成为当下的一个重要课题。B2B跨境电商平台买卖双方在平台使用过程中,能产生海量的需求和行为线索数据,服务于数据挖掘、机器学习和智能买家推荐,可以提升平台推荐的转化率和买卖双方的成交率。
有鉴于此,本发明人针对上述问题未臻完善所导致的诸多缺失及不便,而深入构思,且积极研究改良试做而开发设计出本发明。
发明内容
本发明的目的在于提供一种买家公司推荐方法,向卖家公司推荐潜在买家,具有准确率和参考性高的特点,以提升平台推荐的转化率和买卖双方的成交率。
为了达成上述目的,本发明的解决方案是:
一种买家公司推荐方法,包括以下步骤:
步骤1、获取数据
通过设置爬虫获取网页数据和产品数据;所述网页数据包括对买家公司本身以及产品或者服务的文本描述;所述产品数据包括卖家的偏好信息、卖家的历史创建行为和买卖双方的交互行为数据;卖家的偏好信息为卖家设置的关键词,包括产品关键词;
步骤2、召回候选买家公司
2-1预设召回量N,使用步骤1中卖家的偏好信息作为召回规则,针对卖家的偏好信息对买家公司进行硬性过滤,并将产品关键词与网页数据通过短语匹配方式进行匹配,召回N个符合卖家模型的候选买家公司;
2-2多级弱化过程:当步骤2-1中召回的候选买家数量小于N时,按卖家的偏好信息中关键词信息的重要度由弱至强的的优先级顺序,依次从2-1中的过滤步骤中去除关键词,重复2-1,直至召回数量达到N,步骤2终止;
步骤3、买家创建率预估
3-1特征计算:通过步骤2-1中短语匹配方式获取文本相似度特征;采用spark的sql+RDD框架对卖家的历史创建行为和买卖双方的交互行为数据进行数据工程计算获得卖家偏好特征和买卖双方交互行为特征;
3-2模型训练:对于历史候选买家公司,根据最后曝光时间通过步骤3-1计算历史候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,以候选项是否在曝光后被“创建为公司”的二元标记作为标签,训练GBDT模型;
3-3创建率预估:使用步骤3-2中训练好的GBDT模型和步骤3-1中N个候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,对N个候选买家公司进行创建率预估,得到每个候选买家公司的创建率;
3-4预设筛选数K,根据3-3中得到的每个候选买家公司的创建率对N个候选买家公司进行排序,筛选排序靠前的K个候选买家公司作为最终的买家公司推荐展示结果。
所述步骤1中,卖家的偏好信息包括按照重要程度依次排序的产品关键词、国家、行业、公司规模和联系人人数。
通过上述算法,其结果可以给卖家公司推荐潜在买家,方便卖家参考;通过召回过程中的多级弱化,保证召回的候选买家公司数量满足卖家需求,避免因召回规则过于严格而无法形成足够召回量的情形;机器学习模型的特征除了文本相似度外还采取卖家的历史创建行为和买卖双方的交互行为数据,构建多维度特征,提升买家推荐的准确率和参考性,以提升平台推荐的转化率和买卖双方的成交率,从而提升卖家的销售效率和销售量。
附图说明
图1为本发明步骤2-2多级弱化过程的示意图。
具体实施方式
为了进一步解释本发明的技术方案,下面通过具体实施例来对本发明进行详细阐述。
一种买家公司推荐方法,包括以下步骤:
步骤1、获取数据
通过设置爬虫获取买家公司官网主页或一级界面(例如带有“products”、“services”等关键词的子页面)上的网页数据和产品数据。
上述网页数据包括对买家公司本身以及产品或者服务的文本描述;上述产品数据包括卖家的偏好信息、卖家的历史创建行为和买卖双方的交互行为数据;卖家的偏好信息为卖家设置的关键词信息,按照重要程度排序依次为产品关键词、国家、行业、公司规模和联系人人数。
步骤2、召回候选买家公司
将步骤1中获取的网页数据与产品数据作过滤和短语匹配,召回N个候选买家公司。
2-1初始召回过程:预设召回量N,使用步骤1中卖家的偏好信息作为召回规则,从千万级别的数据中召回N个符合卖家模型的候选买家公司。初始召回阶段的规则包含下述两类:
a.过滤——针对卖家的偏好信息对买家的国家、行业、公司规模和联系人人数进行硬性过滤;
b.匹配——将产品关键词与网页数据通过短语匹配方式(Match Phrase)进行匹配。
2-2多级弱化过程:如图1所示,当步骤2-1中召回的候选买家公司数量小于N时,按联系人人数、公司规模、所属行业、所属国家的优先级顺序,依次从2-1中的过滤步骤中去除关键词信息,重复2-1,直至召回数量达到N,步骤2终止。
步骤3、买家创建率预估
利用步骤2产生的文本相似度特征,结合步骤1中的产品数据,通过机器学习算法对步骤2中的N个候选买家公司进行创建率(卖家与买家的成交可能性)预估。
3-1特征计算:通过步骤2-1中短语匹配方式获取文本相似度特征;采用spark的sql+RDD框架对卖家的历史创建行为和买卖双方的交互行为数据进行数据工程计算获得卖家偏好特征和买卖双方交互行为特征。
上述买卖双方交互行为是卖家在该买家所属产品和服务类别中的历史推荐交互行为,类似于传统意义上的user和item交互行为,如淘宝用户什么时候对哪个商品添加购物车、youtube用户什么时候对哪个视频点赞,本发明的场景下user为卖家公司,item为候选买家公司,卖家在使用本发明推荐出的买家结果的过程中,能产生丰富的交互数据。
上述卖家偏好是卖家在产品其他功能中(搜索、邮件联络等)体现的买家公司偏好包括卖家的历史创建行为及其他相关行为,用户对多重产品功能的使用情况和反馈都会进行特征提取。
3-2模型训练:对于所有可利用的历史候选买家公司(实际在前端曝光给卖家的所有历史候选买家公司,可理解为“召回的N个候选买家公司”的子集),根据最后曝光时间通过步骤3-1计算历史候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,以历史候选买家公司是否在曝光后被卖家公司“创建为目标客户”的二元标记作为标签(label),训练GBDT(梯度提升树)二分类模型。
3-3创建率预估:使用步骤3-2中训练好的GBDT模型和步骤3-1中N个候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,对N个候选买家公司进行创建率预估,得到每个候选买家公司的创建率。
3-4预设筛选数K,根据3-3中得到的每个候选买家公司的创建率对N个候选买家公司进行排序,筛选排序靠前的K个候选买家公司作为最终的买家公司推荐展示结果。
通过上述算法,其结果可以给卖家公司推荐潜在买家,方便卖家参考;通过召回过程中的多级弱化,保证了召回的候选买家公司数量满足卖家需求,避免因召回规则过于严格而无法形成足够召回量的情形;机器学习模型的特征除了文本相似度外还采取卖家的历史创建行为和买卖双方的交互行为数据,构建多维度特征,提升买家推荐的准确率和参考性,以提升平台推荐的转化率和买卖双方的成交率,从而提升卖家的销售效率和销售量。
上述实施例和图式并非限定本发明的产品形态和式样,任何所属技术领域的普通技术人员对其所做的适当变化或修饰,皆应视为不脱离本发明的专利范畴。
Claims (2)
1.一种买家公司推荐方法,其特征在于包括以下步骤:
步骤1、获取数据
通过设置爬虫获取网页数据和产品数据;所述网页数据包括对买家公司本身以及产品或者服务的文本描述;所述产品数据包括卖家的偏好信息、卖家的历史创建行为和买卖双方的交互行为数据;卖家的偏好信息为卖家设置的关键词,包括产品关键词;
步骤2、召回候选买家公司
2-1预设召回量N,使用步骤1中卖家的偏好信息作为召回规则,针对卖家的偏好信息对买家公司进行硬性过滤,并将产品关键词与网页数据通过短语匹配方式进行匹配,召回N个符合卖家模型的候选买家公司;
2-2多级弱化过程:当步骤2-1中召回的候选买家数量小于N时,按卖家的偏好信息中关键词信息的重要度由弱至强的的优先级顺序,依次从2-1中的过滤步骤中去除关键词,重复2-1,直至召回数量达到N,步骤2终止;
步骤3、买家创建率预估
3-1特征计算:通过步骤2-1中短语匹配方式获取文本相似度特征;采用spark的sql+RDD框架对卖家的历史创建行为和买卖双方的交互行为数据进行数据工程计算获得卖家偏好特征和买卖双方交互行为特征;
3-2模型训练:对于历史候选买家公司,根据最后曝光时间通过步骤3-1计算历史候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,以历史候选买家公司是否在曝光后被“创建为公司”的二元标记作为标签,训练GBDT模型;
3-3创建率预估:使用步骤3-2中训练好的GBDT模型和步骤3-1中N个候选买家公司的文本相似度特征、卖家偏好特征和买卖双方交互行为特征,对N个候选买家公司进行创建率预估,得到每个候选买家公司的创建率;
3-4预设筛选数K,根据3-3中得到的每个候选买家公司的创建率对N个候选买家公司进行排序,筛选排序靠前的K个候选买家公司作为最终的买家公司推荐展示结果。
2.如权利要求1所述的一种买家公司推荐方法,其特征在于:所述步骤1中,卖家的偏好信息包括按照重要程度依次排序的产品关键词、国家、行业、公司规模和联系人人数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591746.9A CN109767292A (zh) | 2018-12-20 | 2018-12-20 | 一种买家公司推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811591746.9A CN109767292A (zh) | 2018-12-20 | 2018-12-20 | 一种买家公司推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109767292A true CN109767292A (zh) | 2019-05-17 |
Family
ID=66451630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811591746.9A Withdrawn CN109767292A (zh) | 2018-12-20 | 2018-12-20 | 一种买家公司推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109767292A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111666424A (zh) * | 2020-06-10 | 2020-09-15 | 深圳开思时代科技有限公司 | 基于知识表示学习的汽配件询报价优化方法 |
CN112380457A (zh) * | 2020-12-07 | 2021-02-19 | 长沙军民先进技术研究有限公司 | 一种基于采购信息的精准个性化推荐方法 |
CN112541076A (zh) * | 2020-11-09 | 2021-03-23 | 北京百度网讯科技有限公司 | 目标领域的扩充语料生成方法、装置和电子设备 |
CN112686717A (zh) * | 2021-03-11 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 一种广告召回的数据处理方法及系统 |
CN113283965A (zh) * | 2021-06-11 | 2021-08-20 | 武汉智易农批科技有限公司 | 一种选择买家的推荐关键字的方法及系统 |
CN111353688B (zh) * | 2020-02-05 | 2024-02-27 | 口碑(上海)信息技术有限公司 | 一种用户资源分配方法以及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309886A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种基于交易平台的结构化信息搜索方法和装置 |
CN103426096A (zh) * | 2012-05-14 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种推荐用户的方法及装置 |
JP5661977B1 (ja) * | 2014-03-19 | 2015-01-28 | 楽天株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN106980999A (zh) * | 2016-01-19 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种用户推荐的方法和设备 |
CN107730318A (zh) * | 2017-10-30 | 2018-02-23 | 厦门二五八网络科技集团股份有限公司 | 智能客户推荐平台及其推荐方法 |
-
2018
- 2018-12-20 CN CN201811591746.9A patent/CN109767292A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309886A (zh) * | 2012-03-13 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种基于交易平台的结构化信息搜索方法和装置 |
CN103426096A (zh) * | 2012-05-14 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种推荐用户的方法及装置 |
JP5661977B1 (ja) * | 2014-03-19 | 2015-01-28 | 楽天株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN106980999A (zh) * | 2016-01-19 | 2017-07-25 | 阿里巴巴集团控股有限公司 | 一种用户推荐的方法和设备 |
CN107730318A (zh) * | 2017-10-30 | 2018-02-23 | 厦门二五八网络科技集团股份有限公司 | 智能客户推荐平台及其推荐方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353688B (zh) * | 2020-02-05 | 2024-02-27 | 口碑(上海)信息技术有限公司 | 一种用户资源分配方法以及装置 |
CN111666424A (zh) * | 2020-06-10 | 2020-09-15 | 深圳开思时代科技有限公司 | 基于知识表示学习的汽配件询报价优化方法 |
CN112541076A (zh) * | 2020-11-09 | 2021-03-23 | 北京百度网讯科技有限公司 | 目标领域的扩充语料生成方法、装置和电子设备 |
CN112541076B (zh) * | 2020-11-09 | 2024-03-29 | 北京百度网讯科技有限公司 | 目标领域的扩充语料生成方法、装置和电子设备 |
CN112380457A (zh) * | 2020-12-07 | 2021-02-19 | 长沙军民先进技术研究有限公司 | 一种基于采购信息的精准个性化推荐方法 |
CN112686717A (zh) * | 2021-03-11 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 一种广告召回的数据处理方法及系统 |
CN112686717B (zh) * | 2021-03-11 | 2021-07-02 | 腾讯科技(深圳)有限公司 | 一种广告召回的数据处理方法及系统 |
CN113283965A (zh) * | 2021-06-11 | 2021-08-20 | 武汉智易农批科技有限公司 | 一种选择买家的推荐关键字的方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109767292A (zh) | 一种买家公司推荐方法 | |
CN106844787B (zh) | 一种为汽车行业寻找目标用户并匹配目标产品的推荐方法 | |
CN107861972B (zh) | 一种用户录入商品信息后显示商品全结果的方法及设备 | |
WO2018040944A1 (zh) | 恶意地址/恶意订单的识别系统、方法及装置 | |
CN111784455A (zh) | 一种物品推荐方法及推荐设备 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN102150178A (zh) | 将补充内容项目用作识别其他所关注的内容项目的搜索标准的系统和方法 | |
CN103412937A (zh) | 一种基于手持终端的搜索购物方法 | |
CN106682926A (zh) | 搜索广告的投放方法及装置 | |
CN111080409A (zh) | 一种推送信息的计算机装置、方法、设备及介质 | |
CN113570413B (zh) | 广告关键词的生成方法、装置、存储介质及电子设备 | |
CN111666424A (zh) | 基于知识表示学习的汽配件询报价优化方法 | |
CN110163703B (zh) | 一种分类模型建立方法、文案推送方法和服务器 | |
CN111667337A (zh) | 一种商品评价的排序方法和系统 | |
CN112700274A (zh) | 一种基于用户偏好的广告点击率预估方法 | |
CN111340566B (zh) | 一种商品分类方法、装置、电子设备及存储介质 | |
CN112232907A (zh) | 一种用于直播销售的商品筛选系统及其工作方法 | |
CN113689233A (zh) | 广告投放选品方法及其相应的装置、设备、介质 | |
CN113516496A (zh) | 广告转化率预估模型构建方法、装置、设备及其介质 | |
CN115147130A (zh) | 问题预测方法、设备、存储介质及程序产品 | |
CN113065928A (zh) | 一种基于大数据的电商交易方法 | |
CN115641179A (zh) | 信息推送方法、装置及电子设备 | |
US20240134860A1 (en) | Order searching method, apparatus, computer device, and storage medium | |
Srivastava et al. | Improved market basket analysis with utility mining | |
CN116883117A (zh) | 一种预测分析驱动的智能客户服务平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20190517 |
|
WW01 | Invention patent application withdrawn after publication |