CN105095311A - 推广信息的处理方法、装置及系统 - Google Patents

推广信息的处理方法、装置及系统 Download PDF

Info

Publication number
CN105095311A
CN105095311A CN201410218795.3A CN201410218795A CN105095311A CN 105095311 A CN105095311 A CN 105095311A CN 201410218795 A CN201410218795 A CN 201410218795A CN 105095311 A CN105095311 A CN 105095311A
Authority
CN
China
Prior art keywords
promotion message
keyword
intention
described promotion
matching characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410218795.3A
Other languages
English (en)
Other versions
CN105095311B (zh
Inventor
霍承富
李波
林锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Singapore Holdings Pte Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201410218795.3A priority Critical patent/CN105095311B/zh
Priority to TW103134412A priority patent/TWI662495B/zh
Priority to US14/717,891 priority patent/US20150339700A1/en
Priority to PCT/US2015/031829 priority patent/WO2015179556A1/en
Publication of CN105095311A publication Critical patent/CN105095311A/zh
Application granted granted Critical
Publication of CN105095311B publication Critical patent/CN105095311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • G06Q30/0243Comparative campaigns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0247Calculate past, present or future revenues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请提供推广信息的处理方法、装置及系统。一方面,本申请实施例由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,保证了PS与RS的计算逻辑的一致性,能够避免由于PS与RS的计算逻辑不一致而导致的推广信息的质量与推广信息的展现位置不一致的问题,从而提高了推广信息的推送有效性。

Description

推广信息的处理方法、装置及系统
【技术领域】
本申请涉及信息推送技术,尤其涉及推广信息的处理方法、装置及系统。
【背景技术】
近年来,随着互联网技术的发展,逐渐兴起了推广信息的推送服务,例如,广告推送、游戏推送或应用推送等。推广信息的推广评分(PromotionScore,PS),是推广商在推广信息的推送时能够获得的后台操作平台唯一反馈的推广信息的质量即推广信息与关键词的相关性的标准。推广商可以根据推广信息的PS,为自己的推广信息选择相关的关键词(Keyword),并针对每个关键词给出一个价格即关键词的价格(BidPrice),以供搜索引擎在每个查询词下,根据推广商所给出的价格和推广信息的预测点击率(estimatedClickThroughRate,eCTR),计算出推广信息的排序评分(RankScore,RS),以对推广信息进行展现位置的排序。
然而,由于PS与RS的计算逻辑不一致,因此,可能会出现推广信息的质量与推广信息的展现位置不一致的情况,例如,PS较高的推广信息并不一定能够获得RS较好的展现位置等情况,从而导致了推广信息的推送有效性的降低。另外一个问题是现有技术未考虑隐藏词干预和类目特征匹配,导致PS的计算不够准确。
【发明内容】
本申请的多个方面提供推广信息的处理方法、装置及系统,用以提高推广信息的推送有效性,或者提高推广信息的PS的准确性。
本申请的一方面,提供一种推广信息的处理方法,包括:
根据用户输入的查询词,获得与所述查询词匹配的推广信息;
根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征;
根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR;
根据所述eCTR和所述查询词的价格,获得所述推广信息的RS;
根据所述RS,确定所述推广信息的展现位置。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR之前,还包括:
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述关键词,获得所述关键词的初始意图,包括:
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征,包括:
利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述推广信息与所述查询词的相关性特征包括:
所述推广信息与所述查询词的组合特征。
本申请的另一方面,提供一种推广信息的处理装置,包括:
匹配单元,用于根据用户输入的查询词,获得与所述查询词匹配的推广信息;
特征单元,用于根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征;
预测单元,用于根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR;
评分单元,用于根据所述eCTR和所述查询词的价格,获得所述推广信息的RS;
确定单元,用于根据所述RS,确定所述推广信息的展现位置。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特征单元所获得的所述推广信息与所述查询词的相关性特征包括:
所述推广信息与所述查询词的组合特征。
本申请的另一方面,提供一种推广信息的处理系统,包括后台操作平台和上述方面所提供的推广信息的处理装置;其中,
所述后台操作平台,用于获得所述推广信息的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述后台操作平台,还用于
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征;以及
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述后台操作平台,具体用于
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;以及
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述后台操作平台,具体用于
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;以及
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述后台操作平台,具体用于
利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;以及
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
本申请的另一方面,提供另一种推广信息的处理方法,包括:
获取待处理的推广信息;
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
本申请的另一方面,提供另一种推广信息的处理方法,包括:
获取待处理的推广信息;
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
利用所述隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
本申请的另一方面,提供另一种推广信息的处理装置,包括:
获取单元,用于获取待处理的推广信息;
文本匹配单元,用于根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的文本匹配特征;
意图匹配单元,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的意图匹配特征;
评分单元,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述意图匹配单元,具体用于
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;以及
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
本申请的另一方面,提供另一种推广信息的处理装置,包括:
获取单元,用于获取待处理的推广信息;
文本匹配单元,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
意图匹配单元,用于根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征;
评分单元,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述意图匹配单元,具体用于
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
利用所述隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;以及
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
由上述技术方案可知,一方面,本申请实施例通过根据用户输入的查询词和与该查询词匹配的推广信息,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,进而根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR,使得能够根据所述eCTR和所述查询词的价格,获得所述推广信息的RS,以供根据所述RS,确定所述推广信息的展现位置,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,保证了PS与RS的计算逻辑的一致性,能够避免由于PS与RS的计算逻辑不一致而导致的推广信息的质量与推广信息的展现位置不一致的问题,从而提高了推广信息的推送有效性。
另外,采用本申请提供的技术方案,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,使得能够通过优化推广信息的质量来改善推广信息的展现位置,这样,能够很好的满足推广商的收益需求。
另外,采用本申请提供的技术方案,由于所述推广信息与所述查询词的相关性特征中的所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征为推广信息的PS的计算因子,使得可以利用推广信息的PS代替所述推广信息与所述查询词的相关性特征中所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,作为一个新的计算因子引入eCTR,因此,所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,无需参与eCTR的计算,能够有效降低eCTR预测的复杂度,从而提高了查询的效率。
另外,采用本申请提供的技术方案,由于没有改变推广信息的PS的计算逻辑,在推广信息的内容不修改的情况下,只需要计算一次即可存入数据库,无需更新,能够有效避免计算资源耗费,且不会影响计算性能。
由上述技术方案可知,另一方面,本申请实施例通过根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
由上述技术方案可知,另一方面,本申请实施例通过利用隐藏词干预特征,对关键词的初始意图和推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的一种推广信息的处理方法的流程示意图;
图2为本申请另一实施例提供的一种推广信息的处理装置的结构示意图;
图3为本申请另一实施例提供的一种推广信息的处理系统的结构示意图;
图4为本申请另一实施例提供的另一种推广信息的处理方法的流程示意图;
图5为本申请另一实施例提供的另一种推广信息的处理方法的流程示意图;
图6为本申请另一实施例提供的另一种推广信息的处理装置的结构示意图;
图7为本申请另一实施例提供的另一种推广信息的处理装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中所涉及的终端可以包括但不限于手机、个人数字助理(PersonalDigitalAssistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、平板电脑、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜,智能手表,智能手环)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本申请一实施例提供的一种推广信息的处理方法的流程示意图,如图1所示,该处理方法包括101~105五个执行模块。
需要说明的是,101~105的执行主体可以是搜索引擎,可以位于本地的应用中,或者还可以位于网络侧的服务器中,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeApp),或者还可以是终端上的浏览器的一个网页(webApp),只要能够实现查询词的搜索,以提供与之匹配的推广信息的客观存在形式都可以,本实施例对此不进行限定。
101、根据用户输入的查询词,获得与所述查询词匹配的推广信息。
可选地,在本实施例的一个可能的实现方式中,在101中,搜索引擎具体可以采用精确匹配方法,精确匹配出与用户输入的查询词对应的推广商为推广信息所选择的关键词,或者还可以采用模糊匹配方法,模糊匹配出与用户输入的查询词对应的推广商为推广信息所选择的关键词,进而再根据所匹配出的关键词,获得与该关键词绑定的推广信息,本实施例对查询词的匹配方法不进行特别限定。
具体地,推广商具体可以根据推广信息,为所述推广信息选择相关的一个或多个关键词。例如,推广信息为一家花店的广告,那么,则可以为该推广信息选择一个关键词即“鲜花”,或者还可以选择多个关键词即“鲜花”、“鲜花速递”和“鲜花预定”等。
其中,搜索引擎所采用的精确匹配方法和模糊匹配方法的详细描述可以参见现有技术中的相关内容,此处不再赘述。
可以理解的是,搜索引擎通过执行101所获得的推广信息可以为多个推广信息,只要与查询词能够匹配的关键词所绑定的推广信息,均可以作为101的执行结果。
102、根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征。
可选地,在本实施例的一个可能的实现方式中,在102中,搜索引擎具体可以根据所述推广信息,获得所述推广信息的内容特征。例如,推广信息的标题的中心词、推广信息的标题中的高频词、推广信息的标识信息(ID)、推广信息的类目标识、推广信息的历史平均点击率等。
可选地,在本实施例的一个可能的实现方式中,在102中,搜索引擎具体可以根据所述查询词,获得所述查询词的内容特征。例如,查询词的标识信息(ID)、查询词中的名称、查询词本身、查询词中的形容词、查询词中的型号、查询词的历史平均点击率等。
可选地,在本实施例的一个可能的实现方式中,在102中,搜索引擎具体可以根据所述推广信息和所述查询词,获得所述推广信息与所述查询词的相关性特征。
具体地,所述推广信息与所述查询词的相关性特征具体可以包括所述推广信息与所述查询词的相关性特征中,除了所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征之外,的其他特征,即所述推广信息与所述查询词的组合特征。例如,推广信息的标题的中心词与查询词的组合特征,或者,再例如,推广信息的ID与查询词的ID的组合特征等。
103、根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR。
由于所述推广信息与所述查询词的相关性特征中的所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征为推广信息的PS的计算因子,使得可以利用推广信息的PS代替所述推广信息与所述查询词的相关性特征中所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,作为一个新的计算因子引入eCTR,因此,所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,无需参与eCTR的计算,能够有效降低eCTR预测的复杂度,从而提高了查询的效率。
可选地,在本实施例的一个可能的实现方式中,在103中,搜索引擎具体可以根据所述推广信息,利用预先获得的推广信息与推广信息的PS的对应关系,获得与所述推广信息对应的所述推广信息的PS。
可以理解的是,一般来说,一个推广信息的关键词不止一个,因此,相应地,推广信息的PS也不止一个。具体地,搜索引擎选择哪个PS,需要进一步根据用户所输入的查询词来确定。
例如,搜索引擎可以选择推广信息在与用户所输入的查询词最相似的关键词下的PS,具体的匹配方法,可以参考现有技术中的任意一种文本匹配方法的相关内容,此处不再赘述。
具体地,在103之前,还可以进一步建立推广信息与推广信息的PS的对应关系。具体地,后台操作平台可以根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征。然后,所述后台操作平台则可以根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS,以建立推广信息与推广信息的PS的对应关系。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
具体地,所述后台操作平台具体可以根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
具体地,所述后台操作平台具体可以根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些关键词的含义较为宽泛,使得无法根据关键词,准确定位关键词的初始意图。可选地,所述后台操作平台具体可以根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。其中,所述后台操作平台具体可以根据用户点击行为数据,获得所述关键词与类目匹配特征的对应关系。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,如果没有任何辅助信息,对于“2014women”这个关键词,后台操作平台很难获得用户的真正意图,导致后台操作平台给不出用户期望的推广信息。如果指定时间范围内如近一个月内用户点击行为数据显示,用户输入查询词“2014women”之后,60%的用户点击了女士服装类目的产品,40%的用户点击了女士鞋子类目的产品,那么,后台操作平台则会基于用户点击行为数据预测“2014women”这个关键词的类目匹配特征是女士服装和女士鞋子。有了“2014women”类目匹配特征的这一预测结果之后,当推广商利用后台操作平台推广女士服装和女士鞋子类目的推广信息时,如果选择关键词为“2014women”进行绑定,那么,推广信息的PS就会判定为优。
因此,在一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
由于一些推广信息的主题的中心词或者关键词的中心词可能会被错误地识别,使得无法根据所识别出的中心词,准确定位推广信息的初始意图。可选地,后台操作平台具体可以利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,假设关键词为“iphone”,推广信息的标题为“2014bestsellingiphonecase”,如果标题的中心词被识别为iphone,那么,后台操作平台就会判断推广信息与关键词的意图匹配一致。然而,其实推广信息的内容其实是iphonecase(手机壳),其中,case就属于隐藏词,也就是说,推广信息与关键词的意图匹配不一致。为了避免上述情况,后台操作平台则可以利用所存储的隐藏词干预特征,如果推广信息的标题中有case,那么,就会将标题的中心词由iphone修正为iphonecase,从而保证了推广信息的真正意图能够被正确识别,不被曲解。
因此,在另一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
结合上述两种实施方式所提供的内容,还可以在另一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
其中,所述规则模型具体可以利用用户点击行为数据,对逻辑回归(LogisticRegression,LR)模型进行训练,获得。其中,该预测模型的特征可以包括但不限于推广信息的PS、推广信息的内容特征和查询词的内容特征、以及推广信息与查询词的相关性特征。
具体地,用户点击行为数据的内容格式可以为表1所示,其中,可以包括但不限于查询词(Query)、推广信息的标识信息(Product_ID)、推广信息的标题(Title)、推广信息的展现位置(Rank)、推广信息是否被点击(Is_Click)等字段。
表1用户点击行为数据
序号 名称 说明
1 Query 查询词
2 Product_ID 推广信息的标识信息
3 Title 推广信息的标题
4 Rank 推广信息的展现位置
5 Is_Click 推广信息是否被点击
…… …… ……
可选地,在利用用户点击行为数据进行模型训练之前,还可以进一步对用户点击行为数据进行预处理,例如,反欺诈、反爬虫数据过滤、虚曝光数据过滤等。
例如,可以根据用户在每个网页的停留时间长短,判断推广信息是否真正曝光(被用户浏览),过滤掉停留时间过短的虚曝光,能够有效地提高预处理得到的用户点击行为数据的质量。
具体可以采用如下表达式 P ( E i = 1 | t i ) = 1 , t i &GreaterEqual; T 0 , t i < T 所表示的预处理模型,对用户点击行为数据进行预处理。其中,t表示停留时间,T为基于大量数据统计得到的阈值。当t≥T时表明用户在该页面停留了足够长的时间,真正浏览到了该页面展现的推广信息,否则该页面展现的推广信息就没有真正曝光。如,当用户快速从搜索结果页面的最上方拉到最下方时,中间所展现的推广信息就没有被用户浏览到,不算真正的曝光,在选择样本数据时,则可以剔除这部分数据,提高预测模型的样本数据的可信度。
基于上述描述,搜索引擎所利用的eCTR的计算公式可以表示为如下形式:
eCTR=f2(fea_p,fea_q,fea_r,fea_ps)。
其中,fea_p可以表示推广信息(product)的内容特征;fea_q可以表示查询词(query)的内容特征;fea_r可以表示推广信息与查询词的相关性(relative)特征;fea_ps可以表示推广信息的PS特征;f2函数可以表示基于LR模型训练所获得的预测模型。详细描述可以参见现有技术中LR模型的训练方法的相关内容,此处不再赘述。
104、根据所述eCTR和所述查询词的价格,获得所述推广信息的RS。
可选地,在本实施例的一个可能的实现方式中,在104中,搜索引擎具体可以根据所述eCTR和所述查询词的价格,利用公式RS=eCTR*BidPrice,获得所述推广信息的RS。
105、根据所述RS,确定所述推广信息的展现位置。
可选地,在本实施例的一个可能的实现方式中,在105中,搜索引擎具体可以根据每个推广信息的RS所排列的逆序,确定推广信息的展现位置。
本实施例中,通过根据用户输入的查询词和与该查询词匹配的推广信息,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,进而根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR,使得能够根据所述eCTR和所述查询词的价格,获得所述推广信息的RS,以供根据所述RS,确定所述推广信息的展现位置,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,保证了PS与RS的计算逻辑的一致性,能够避免由于PS与RS的计算逻辑不一致而导致的推广信息的质量与推广信息的展现位置不一致的问题,从而提高了推广信息的推送有效性。
另外,采用本申请提供的技术方案,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,使得能够通过优化推广信息的质量来改善推广信息的展现位置,这样,能够很好的满足推广商的收益需求。
另外,采用本申请提供的技术方案,由于所述推广信息与所述查询词的相关性特征中的所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征为推广信息的PS的计算因子,使得可以利用推广信息的PS代替所述推广信息与所述查询词的相关性特征中所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,作为一个新的计算因子引入eCTR,因此,所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,无需参与eCTR的计算,能够有效降低eCTR预测的复杂度,从而提高了查询的效率。
另外,采用本申请提供的技术方案,由于没有改变推广信息的PS的计算逻辑,在推广信息的内容不修改的情况下,只需要计算一次即可存入数据库,无需更新,能够有效避免计算资源耗费,且不会影响计算性能。
图4为本申请另一实施例提供的另一种推广信息的处理方法的流程示意图,如图4所示,该处理方法包括401~404四个执行模块。
需要说明的是,401~404的执行主体可以是处理装置,可以位于网络侧的后台操作平台中,本实施例对此不进行特别限定。
401、获取待处理的推广信息。
402、根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征。
403、根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的意图匹配特征。
404、根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
可选地,在本实施例的一个可能的实现方式中,在402中,所述处理装置具体可以根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
可选地,在本实施例的一个可能的实现方式中,在403中,所述处理装置具体可以根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些关键词的含义较为宽泛,使得无法根据关键词,准确定位关键词的初始意图。具体地,在403中,所述处理装置具体可以根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。其中,所述处理装置具体可以根据用户点击行为数据,获得所述关键词与类目匹配特征的对应关系。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,如果没有任何辅助信息,对于“2014women”这个关键词,处理装置很难获得用户的真正意图,导致处理装置给不出用户期望的推广信息。如果指定时间范围内如近一个月内用户点击行为数据显示,用户输入查询词“2014women”之后,60%的用户点击了女士服装类目的产品,40%的用户点击了女士鞋子类目的产品,那么,处理装置则会基于用户点击行为数据预测“2014women”这个关键词的类目匹配特征是女士服装和女士鞋子。有了“2014women”类目匹配特征的这一预测结果之后,当推广商利用处理装置推广女士服装和女士鞋子类目的推广信息时,如果选择关键词为“2014women”进行绑定,那么,推广信息的PS就会判定为优。
因此,在一种实施方式中,处理装置所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
本实施例中,通过根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
图5为本申请另一实施例提供的另一种推广信息的处理方法的流程示意图,如图5所示,该处理方法包括501~504四个执行模块。
需要说明的是,501~504的执行主体可以是处理装置,可以位于网络侧的后台操作平台中,本实施例对此不进行特别限定。
501、获取待处理的推广信息。
502、根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征。
503、根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征。
504、根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
可选地,在本实施例的一个可能的实现方式中,在502中,所述处理装置具体可以根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
可选地,在本实施例的一个可能的实现方式中,在503中,所述处理装置具体可以根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些推广信息的主题的中心词或者关键词的中心词可能会被错误地识别,使得无法根据所识别出的中心词,准确定位推广信息的初始意图。具体地,在503中,处理装置具体可以利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,假设关键词为“iphone”,推广信息的标题为“2014bestsellingiphonecase”,如果标题的中心词被识别为iphone,那么,处理装置就会判断推广信息与关键词的意图匹配一致。然而,其实推广信息的内容其实是iphonecase(手机壳),其中,case就属于隐藏词,也就是说,推广信息与关键词的意图匹配不一致。为了避免上述情况,处理装置则可以利用所存储的隐藏词干预特征,如果推广信息的标题中有case,那么,就会将标题的中心词由iphone修正为iphonecase,从而保证了推广信息的真正意图能够被正确识别,不被曲解。
因此,在另一种实施方式中,处理装置所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
本实施例中,通过利用隐藏词干预特征,对关键词的初始意图和推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本申请另一实施例提供的一种推广信息的处理装置的结构示意图,如图2所示。本实施例的推广信息的处理装置可以包括匹配单元21、特征单元22、预测单元23、评分单元24和确定单元25。其中,匹配单元21,用于根据用户输入的查询词,获得与所述查询词匹配的推广信息;特征单元22,用于根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征;预测单元23,用于根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR;评分单元24,用于根据所述eCTR和所述查询词的价格,获得所述推广信息的RS;确定单元25,用于根据所述RS,确定所述推广信息的展现位置。
需要说明的是,本实施例所提供的推广信息的处理装置可以是搜索引擎,可以位于本地的应用中,或者还可以位于网络侧的服务器中,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的应用程序(nativeapp),或者还可以是终端上的浏览器的一个网页(webapp),只要能够实现查询词的搜索,以提供与之匹配的推广信息的客观存在形式都可以,本实施例对此不进行限定。
可选地,在本实施例的一个可能的实现方式中,匹配单元21具体可以采用精确匹配方法,精确匹配出与用户输入的查询词对应的推广商为推广信息所选择的关键词,或者还可以采用模糊匹配方法,模糊匹配出与用户输入的查询词对应的推广商为推广信息所选择的关键词,进而再根据所匹配出的关键词,获得与该关键词绑定的推广信息,本实施例对查询词的匹配方法不进行特别限定。
具体地,推广商具体可以根据推广信息,为所述推广信息选择相关的一个或多个关键词。例如,推广信息为一家花店的广告,那么,则可以为该推广信息选择一个关键词即“鲜花”,或者还可以选择多个关键词即“鲜花”、“鲜花速递”和“鲜花预定”等。
其中,匹配单元21所采用的精确匹配方法和模糊匹配方法的详细描述可以参见现有技术中的相关内容,此处不再赘述。
可以理解的是,匹配单元21通过执行对应操作所获得的推广信息可以为多个推广信息,只要与查询词能够匹配的关键词所绑定的推广信息,均可以作为操作的执行结果。
可选地,在本实施例的一个可能的实现方式中,特征单元22具体可以根据所述推广信息,获得所述推广信息的内容特征。例如,推广信息的标题的中心词、推广信息的标题中的高频词、推广信息的标识信息(ID)、推广信息的类目标识、推广信息的历史平均点击率等。
可选地,在本实施例的一个可能的实现方式中,特征单元22具体可以根据所述查询词,获得所述查询词的内容特征。例如,查询词的标识信息(ID)、查询词中的名称、查询词本身、查询词中的形容词、查询词中的型号、查询词的历史平均点击率等。
可选地,在本实施例的一个可能的实现方式中,特征单元22具体可以根据所述推广信息和所述查询词,获得所述推广信息与所述查询词的相关性特征。
具体地,所述特征单元22所获得的所述推广信息与所述查询词的相关性特征具体可以包括所述推广信息与所述查询词的相关性特征中,除了所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征之外,的其他特征,即所述推广信息与所述查询词的组合特征。例如,推广信息的标题的中心词与查询词的组合特征,或者,再例如,推广信息的ID与查询词的ID的组合特征等。
这样,由于所述推广信息与所述查询词的相关性特征中的所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征为推广信息的PS的计算因子,使得可以利用推广信息的PS代替所述推广信息与所述查询词的相关性特征中所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,作为一个新的计算因子引入eCTR,因此,所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,无需参与eCTR的计算,能够有效降低eCTR预测的复杂度,从而提高了查询的效率。
可选地,在本实施例的一个可能的实现方式中,预测单元23具体可以根据所述推广信息,利用预先获得的推广信息与推广信息的PS的对应关系,获得与所述推广信息对应的所述推广信息的PS。
可以理解的是,一般来说,一个推广信息的关键词不止一个,因此,相应地,推广信息的PS也不止一个。具体地,预测单元23选择哪个PS,需要进一步根据用户所输入的查询词来确定。
例如,预测单元23可以选择推广信息在与用户所输入的查询词最相似的关键词下的PS,具体的匹配方法,可以参考现有技术中的任意一种文本匹配方法的相关内容,此处不再赘述。
具体地,还可以进一步建立推广信息与推广信息的PS的对应关系。具体地,后台操作平台可以根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征。然后,所述后台操作平台则可以根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS,以建立推广信息与推广信息的PS的对应关系。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
具体地,所述后台操作平台具体可以根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
具体地,所述后台操作平台具体可以根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些关键词的含义较为宽泛,使得无法根据关键词,准确定位关键词的初始意图。可选地,所述后台操作平台具体可以根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。其中,所述后台操作平台具体可以根据用户点击行为数据,获得所述关键词与类目匹配特征的对应关系。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,如果没有任何辅助信息,对于“2014women”这个关键词,后台操作平台很难获得用户的真正意图,导致后台操作平台给不出用户期望的推广信息。如果指定时间范围内如近一个月内用户点击行为数据显示,用户输入查询词“2014women”之后,60%的用户点击了女士服装类目的产品,40%的用户点击了女士鞋子类目的产品,那么,后台操作平台则会基于用户点击行为数据预测“2014women”这个关键词的类目匹配特征是女士服装和女士鞋子。有了“2014women”类目匹配特征的这一预测结果之后,当推广商利用后台操作平台推广女士服装和女士鞋子类目的推广信息时,如果选择关键词为“2014women”进行绑定,那么,推广信息的PS就会判定为优。
因此,在一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
由于一些推广信息的主题的中心词或者关键词的中心词可能会被错误地识别,使得无法根据所识别出的中心词,准确定位推广信息的初始意图。可选地,后台操作平台具体可以利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,假设关键词为“iphone”,推广信息的标题为“2014bestsellingiphonecase”,如果标题的中心词被识别为iphone,那么,后台操作平台就会判断推广信息与关键词的意图匹配一致。然而,其实推广信息的内容其实是iphonecase(手机壳),其中,case就属于隐藏词,也就是说,推广信息与关键词的意图匹配不一致。为了避免上述情况,后台操作平台则可以利用所存储的隐藏词干预特征,如果推广信息的标题中有case,那么,就会将标题的中心词由iphone修正为iphonecase,从而保证了推广信息的真正意图能够被正确识别,不被曲解。
因此,在另一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
结合上述两种实施方式所提供的内容,还可以在另一种实施方式中,后台操作平台所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
其中,所述规则模型具体可以利用用户点击行为数据,对逻辑回归(LogisticRegression,LR)模型进行训练,获得。其中,该预测模型的特征可以包括但不限于推广信息的PS、推广信息的内容特征和查询词的内容特征、以及推广信息与查询词的相关性特征。
具体地,用户点击行为数据的内容格式可以为表1所示,其中,可以包括但不限于查询词(Query)、推广信息的标识信息(Product_ID)、推广信息的标题(Title)、推广信息的展现位置(Rank)、推广信息是否被点击(Is_Click)等字段。
可选地,在利用用户点击行为数据进行模型训练之前,还可以进一步对用户点击行为数据进行预处理,例如,反欺诈、反爬虫数据过滤、虚曝光数据过滤等。
例如,可以根据用户在每个网页的停留时间长短,判断推广信息是否真正曝光(被用户浏览),过滤掉停留时间过短的虚曝光,能够有效地提高预处理得到的用户点击行为数据的质量。
具体可以采用如下表达式 P ( E i = 1 | t i ) = 1 , t i &GreaterEqual; T 0 , t i < T 所表示的预处理模型,对用户点击行为数据进行预处理。其中,t表示停留时间,T为基于大量数据统计得到的阈值。当t≥T时表明用户在该页面停留了足够长的时间,真正浏览到了该页面展现的推广信息,否则该页面展现的推广信息就没有真正曝光。如,当用户快速从搜索结果页面的最上方拉到最下方时,中间所展现的推广信息就没有被用户浏览到,不算真正的曝光,在选择样本数据时,则可以剔除这部分数据,提高预测模型的样本数据的可信度。
基于上述描述,预测单元23所利用的eCTR的计算公式可以表示为如下形式:
eCTR=f2(fea_p,fea_q,fea_r,fea_ps)。
其中,fea_p可以表示推广信息(product)的内容特征;fea_q可以表示查询词(query)的内容特征;fea_r可以表示推广信息与查询词的相关性(relative)特征;fea_ps可以表示推广信息的PS特征;f2函数可以表示基于LR模型训练所获得的预测模型。详细描述可以参见现有技术中LR模型的训练方法的相关内容,此处不再赘述。
可选地,在本实施例的一个可能的实现方式中,评分单元24具体可以根据所述eCTR和所述查询词的价格,利用公式RS=eCTR*BidPrice,获得所述推广信息的RS。
可选地,在本实施例的一个可能的实现方式中,确定单元25具体可以根据每个推广信息的RS所排列的逆序,确定推广信息的展现位置。
本实施例中,通过特征单元根据用户输入的查询词和与该查询词匹配的推广信息,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,进而由预测单元根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR,使得评分单元能够根据所述eCTR和所述查询词的价格,获得所述推广信息的RS,以供确定单元根据所述RS,确定所述推广信息的展现位置,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,保证了PS与RS的计算逻辑的一致性,能够避免由于PS与RS的计算逻辑不一致而导致的推广信息的质量与推广信息的展现位置不一致的问题,从而提高了推广信息的推送有效性。
另外,采用本申请提供的技术方案,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,使得能够通过优化推广信息的质量来改善推广信息的展现位置,这样,能够很好的满足推广商的收益需求。
图3为本申请另一实施例提供的一种推广信息的处理系统的结构示意图,如图3所示。本实施例的推广信息的处理系统可以包括后台操作平台31和图2对应的实施例所提供的推广信息的处理装置32。其中,所述后台操作平台31,用于获得所述推广信息的PS。
其中,所述推广信息的处理装置32的详细描述可以参见图2对应的实施例中的相关内容,此处不再赘述。
可选地,在本实施例的一个可能的实现方式中,所述后台操作平台31,还可以进一步用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征;以及根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS。
可选地,在本实施例的一个可能的实现方式中,所述后台操作平台31,具体可以用于根据所述关键词,获得所述关键词的初始意图;根据所述推广信息,获得所述推广信息的初始意图;以及根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
可选地,在本实施例的一个可能的实现方式中,所述后台操作平台31,具体可以用于根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;以及根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。
可选地,在本实施例的一个可能的实现方式中,所述后台操作平台31,具体可以用于利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;以及根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
本实施例中,通过根据用户输入的查询词和与该查询词匹配的推广信息,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,进而根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR,使得能够根据所述eCTR和所述查询词的价格,获得所述推广信息的RS,以供根据所述RS,确定所述推广信息的展现位置,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,保证了PS与RS的计算逻辑的一致性,能够避免由于PS与RS的计算逻辑不一致而导致的推广信息的质量与推广信息的展现位置不一致的问题,从而提高了推广信息的推送有效性。
另外,采用本申请提供的技术方案,由于将用于表征推广信息的质量的PS作为一个新的计算因子引入eCTR,因此,使得能够通过优化推广信息的质量来改善推广信息的展现位置,这样,能够很好的满足推广商的收益需求。
另外,采用本申请提供的技术方案,由于所述推广信息与所述查询词的相关性特征中的所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征为推广信息的PS的计算因子,使得可以利用推广信息的PS代替所述推广信息与所述查询词的相关性特征中所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,作为一个新的计算因子引入eCTR,因此,所述查询词与所述推广信息的文本匹配特征和所述查询词与所述推广信息的意图匹配特征,无需参与eCTR的计算,能够有效降低eCTR预测的复杂度,从而提高了查询的效率。
另外,采用本申请提供的技术方案,由于没有改变推广信息的PS的计算逻辑,在推广信息的内容不修改的情况下,只需要计算一次即可存入数据库,无需更新,能够有效避免计算资源耗费,且不会影响计算性能。
图6为本申请另一实施例提供的另一种推广信息的处理装置的结构示意图,如图6所示,本实施例提供的推广信息的处理装置可以包括获取单元61、文本匹配单元62、意图匹配单元63和评分单元64。其中,获取单元61,用于获取待处理的推广信息;文本匹配单元62,用于根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的文本匹配特征;意图匹配单元63,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的意图匹配特征;评分单元64,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
需要说明的是,本实施例所提供的推广信息的处理装置,可以位于网络侧的后台操作平台中,本实施例对此不进行特别限定。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
可选地,在本实施例的一个可能的实现方式中,所述文本匹配单元62具体可以根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
可选地,在本实施例的一个可能的实现方式中,所述意图匹配单元63,具体可以用于根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些关键词的含义较为宽泛,使得无法根据关键词,准确定位关键词的初始意图。具体地,所述意图匹配单元63,具体可以根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。其中,所述处理装置具体可以根据用户点击行为数据,获得所述关键词与类目匹配特征的对应关系。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,如果没有任何辅助信息,对于“2014women”这个关键词,所述意图匹配单元63很难获得用户的真正意图,导致处理装置给不出用户期望的推广信息。如果指定时间范围内如近一个月内用户点击行为数据显示,用户输入查询词“2014women”之后,60%的用户点击了女士服装类目的产品,40%的用户点击了女士鞋子类目的产品,那么,所述意图匹配单元63则会基于用户点击行为数据预测“2014women”这个关键词的类目匹配特征是女士服装和女士鞋子。有了“2014women”类目匹配特征的这一预测结果之后,当推广商利用处理装置推广女士服装和女士鞋子类目的推广信息时,如果选择关键词为“2014women”进行绑定,那么,推广信息的PS就会判定为优。
因此,在一种实施方式中,评分单元64所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_cm)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_cm可以表示类目匹配(categorymatch)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
本实施例中,通过意图匹配单元根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征,进而根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
图7为本申请另一实施例提供的另一种推广信息的处理装置的结构示意图,如图7所示,本实施例提供的推广信息的处理装置可以包括获取单元71、文本匹配单元72、意图匹配单元73和评分单元74。其中,获取单元71,用于获取待处理的推广信息;文本匹配单元72,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;意图匹配单元73,用于根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征;评分单元74,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
需要说明的是,本实施例所提供的推广信息的处理装置,可以位于网络侧的后台操作平台中,本实施例对此不进行特别限定。
其中,所述规则模型具体可以利用用户点击行为数据,对梯度提升决策树(GradientBoostingDecisionTree,GBDT)模型进行训练,获得。其中,该规则模型的特征可以包括但不限于推广信息与关键词的文本匹配特征和推广信息与关键词的意图匹配特征。
可选地,在本实施例的一个可能的实现方式中,所述文本匹配单元72,具体可以用于根据所述关键词,获得所述关键词的文本,以及根据所述推广信息,获得所述推广信息的文本,进而能够根据所述推广信息的文本和所述关键词的文本,获得所述推广信息与所述关键词的文本匹配特征。
例如,推广信息与关键词的文本匹配特征,以下简称文本匹配特征,可以为关键词的单词与推广信息的标题的单词匹配的匹配率。例如,假设关键词为“mp3player”,推广信息的标题为“2014bestsellingredmp3”,那么,关键词与标题匹配的单词是mp3,相对于关键词的长度和标题的长度的匹配率分别为1/2和1/5。通常而言,文本匹配特征的取值越大,推广信息与关键词的相关性越好即推广信息的质量越好,推广信息的PS就会越高。
可选地,在本实施例的一个可能的实现方式中,所述意图匹配单元73,具体可以用于根据所述关键词,获得所述关键词的初始意图,以及根据所述推广信息,获得所述推广信息的初始意图,进而根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
例如,推广信息与关键词的意图匹配特征,以下简称意图匹配特征,可以为关键词的中心词与推广信息的标题的中心词是否相同的参数。例如,假设关键词为“batteryofnokiaphone”,推广信息A的标题为“2014bestsellingbatteryfornokiaphone,thelowestprice”,推广信息B的标题为“2014bestsellingnokiaphone,withbatterythebestperformance”。从文本匹配特征的角度看,关键词的单词与推广信息A的标题的单词和推广信息B的标题的单词匹配的匹配率都为3/10,即其文本匹配特征相同。然而,关键词的中心词为battery(用户希望检索结果为电池),推广信息A的标题的中心词为battery(诺基亚手机电池),推广信息B的标题的中心词为nokiaphone(诺基亚手机),通过意图匹配特征,可以度量出关键词与推广信息A的相关性优于关键词与推广信息B的相关性,即推广信息A的质量优于推广信息B的质量。
由于一些推广信息的主题的中心词或者关键词的中心词可能会被错误地识别,使得无法根据所识别出的中心词,准确定位推广信息的初始意图。具体地,所述意图匹配单元73具体可以利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。这样,能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
例如,假设关键词为“iphone”,推广信息的标题为“2014bestsellingiphonecase”,如果标题的中心词被识别为iphone,那么,意图匹配单元73就会判断推广信息与关键词的意图匹配一致。然而,其实推广信息的内容其实是iphonecase(手机壳),其中,case就属于隐藏词,也就是说,推广信息与关键词的意图匹配不一致。为了避免上述情况,意图匹配单元73则可以利用所存储的隐藏词干预特征,如果推广信息的标题中有case,那么,就会将标题的中心词由iphone修正为iphonecase,从而保证了推广信息的真正意图能够被正确识别,不被曲解。
因此,在另一种实施方式中,评分单元74所利用的推广信息的PS的计算公式可以表示为如下形式:
PS=f1(fea_tm,fea_im,fea_it)。
其中,fea_tm可以表示推广信息与关键词的文本匹配(textmatch)特征;fea_im可以表示推广信息与关键词的意图匹配(intentionmatch)特征;fea_it可以表示隐藏词干预(intervene)特征;f1函数可以表示基于GBDT模型训练所获得的规则模型。详细描述可以参见现有技术中GBDT模型的训练方法的相关内容,此处不再赘述。
本实施例中,通过意图匹配单元利用隐藏词干预特征,对关键词的初始意图和推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项,进而根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征,使得能够有效提高推广信息与关键词的意图匹配特征的获取的可靠性,以提高PS计算的准确性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (21)

1.一种推广信息的处理方法,其特征在于,包括:
根据用户输入的查询词,获得与所述查询词匹配的推广信息;
根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征;
根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR;
根据所述eCTR和所述查询词的价格,获得所述推广信息的RS;
根据所述RS,确定所述推广信息的展现位置。
2.根据权利要求1所述的方法,其特征在于,所述根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR之前,还包括:
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS。
3.根据权利要求2所述的方法,其特征在于,所述根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述关键词,获得所述关键词的初始意图,包括:
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征,包括:
利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
6.根据权利要求1~5任一权利要求所述的方法,其特征在于,所述推广信息与所述查询词的相关性特征包括:
所述推广信息与所述查询词的组合特征。
7.一种推广信息的处理装置,其特征在于,包括:
匹配单元,用于根据用户输入的查询词,获得与所述查询词匹配的推广信息;
特征单元,用于根据所述推广信息和所述查询词,获得所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征;
预测单元,用于根据所述推广信息的PS、所述推广信息的内容特征、所述查询词的内容特征、以及所述推广信息与所述查询词的相关性特征,利用预测模型,获得所述推广信息的eCTR;
评分单元,用于根据所述eCTR和所述查询词的价格,获得所述推广信息的RS;
确定单元,用于根据所述RS,确定所述推广信息的展现位置。
8.根据权利要求7所述的装置,其特征在于,所述特征单元所获得的所述推广信息与所述查询词的相关性特征包括:
所述推广信息与所述查询词的组合特征。
9.一种推广信息的处理系统,其特征在于,包括后台操作平台和权利要求7或8所述的推广信息的处理装置;其中,
所述后台操作平台,用于获得所述推广信息的PS。
10.根据权利要求9所述的系统,其特征在于,所述后台操作平台,还用于
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征和所述推广信息与所述关键词的意图匹配特征;以及
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息的PS。
11.根据权利要求10所述的系统,其特征在于,所述后台操作平台,具体用于
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;以及
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
12.根据权利要求11所述的系统,其特征在于,所述后台操作平台,具体用于
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;以及
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图。
13.根据权利要求11或12所述的系统,其特征在于,所述后台操作平台,具体用于
利用隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;以及
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
14.一种推广信息的处理方法,其特征在于,包括:
获取待处理的推广信息;
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
15.根据权利要求14所述的方法,其特征在于,所述根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
16.一种推广信息的处理方法,其特征在于,包括:
获取待处理的推广信息;
根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征;
根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
17.根据权利要求16所述的方法,其特征在于,所述根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征,包括:
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
利用所述隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
18.一种推广信息的处理装置,其特征在于,包括:
获取单元,用于获取待处理的推广信息;
文本匹配单元,用于根据所述推广信息、所述推广信息的关键词和类目匹配特征,获得所述推广信息与所述关键词的文本匹配特征;
意图匹配单元,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的意图匹配特征;
评分单元,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
19.根据权利要求18所述的装置,其特征在于,所述意图匹配单元,具体用于
根据预先设置的关键词与类目匹配特征的对应关系,获得所述关键词对应的类目匹配特征;
根据所述关键词和所述类目匹配特征,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;以及
根据所述推广信息的初始意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
20.一种推广信息的处理装置,其特征在于,包括:
获取单元,用于获取待处理的推广信息;
文本匹配单元,用于根据所述推广信息和所述推广信息的关键词,获得所述推广信息与所述关键词的文本匹配特征;
意图匹配单元,用于根据所述推广信息、所述推广信息的关键词和隐藏词干预特征,获得所述推广信息与所述关键词的意图匹配特征;
评分单元,用于根据所述推广信息与所述关键词的文本匹配特征、以及所述推广信息与所述关键词的意图匹配特征,利用规则模型,获得所述推广信息在所述关键词下的PS。
21.根据权利要求20所述的装置,其特征在于,所述意图匹配单元,具体用于
根据所述关键词,获得所述关键词的初始意图;
根据所述推广信息,获得所述推广信息的初始意图;
利用所述隐藏词干预特征,对所述关键词的初始意图和所述推广信息的初始意图中的至少一项进行修正,以获得所述关键词的修正意图和所述推广信息的修正意图中的至少一项;以及
根据所述推广信息的初始意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的修正意图,或者所述推广信息的修正意图和所述关键词的初始意图,获得所述推广信息与所述关键词的意图匹配特征。
CN201410218795.3A 2014-05-22 2014-05-22 推广信息的处理方法、装置及系统 Active CN105095311B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201410218795.3A CN105095311B (zh) 2014-05-22 2014-05-22 推广信息的处理方法、装置及系统
TW103134412A TWI662495B (zh) 2014-05-22 2014-10-02 推廣資訊的處理方法、裝置及系統
US14/717,891 US20150339700A1 (en) 2014-05-22 2015-05-20 Method, apparatus and system for processing promotion information
PCT/US2015/031829 WO2015179556A1 (en) 2014-05-22 2015-05-20 Method, apparatus and system for processing promotion information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410218795.3A CN105095311B (zh) 2014-05-22 2014-05-22 推广信息的处理方法、装置及系统

Publications (2)

Publication Number Publication Date
CN105095311A true CN105095311A (zh) 2015-11-25
CN105095311B CN105095311B (zh) 2019-07-09

Family

ID=54554717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410218795.3A Active CN105095311B (zh) 2014-05-22 2014-05-22 推广信息的处理方法、装置及系统

Country Status (4)

Country Link
US (1) US20150339700A1 (zh)
CN (1) CN105095311B (zh)
TW (1) TWI662495B (zh)
WO (1) WO2015179556A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018023293A1 (zh) * 2016-07-31 2018-02-08 赵晓丽 一种提醒手机应用降价的方法和提醒系统
CN110069732A (zh) * 2019-03-29 2019-07-30 腾讯科技(深圳)有限公司 一种信息展示的方法、装置及设备
CN110516030A (zh) * 2019-08-26 2019-11-29 北京百度网讯科技有限公司 意图词的确定方法、装置、设备及计算机可读存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170186065A1 (en) * 2015-12-29 2017-06-29 Alibaba Group Holding Limited System and Method of Product Selection for Promotional Display
CN106021516A (zh) * 2016-05-24 2016-10-12 百度在线网络技术(北京)有限公司 搜索方法及装置
WO2019232776A1 (en) 2018-06-08 2019-12-12 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for generating personalized destination recommendations
CN109559158A (zh) * 2018-11-06 2019-04-02 北京奇虎科技有限公司 推广信息投放方法、装置、电子设备及可读存储介质
CN111695044B (zh) * 2019-03-11 2023-08-18 北京柏林互动科技有限公司 用户排名的数据处理方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267806A1 (en) * 2003-06-30 2004-12-30 Chad Lester Promoting and/or demoting an advertisement from an advertising spot of one type to an advertising spot of another type
US20120059708A1 (en) * 2010-08-27 2012-03-08 Adchemy, Inc. Mapping Advertiser Intents to Keywords
US20120131033A1 (en) * 2004-04-07 2012-05-24 Oracle International Corporation Automated scheme for identifying user intent in real-time

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8996406B2 (en) * 2006-02-02 2015-03-31 Microsoft Corporation Search engine segmentation
US7856350B2 (en) * 2006-08-11 2010-12-21 Microsoft Corporation Reranking QA answers using language modeling
US8504437B1 (en) * 2009-11-04 2013-08-06 Google Inc. Dynamically selecting and presenting content relevant to user input
US9319359B1 (en) * 2011-03-31 2016-04-19 Twitter, Inc. Promoting content in a real-time messaging platform
CN103578010A (zh) * 2012-07-26 2014-02-12 阿里巴巴集团控股有限公司 生成流量质量比较参数的方法和装置、广告计费方法
US20160041986A1 (en) * 2014-08-08 2016-02-11 Cuong Duc Nguyen Smart Search Engine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267806A1 (en) * 2003-06-30 2004-12-30 Chad Lester Promoting and/or demoting an advertisement from an advertising spot of one type to an advertising spot of another type
US20120131033A1 (en) * 2004-04-07 2012-05-24 Oracle International Corporation Automated scheme for identifying user intent in real-time
US20120059708A1 (en) * 2010-08-27 2012-03-08 Adchemy, Inc. Mapping Advertiser Intents to Keywords

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王兵: ""一种基于逻辑回归模型的搜索广告点击率预估方法的研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018023293A1 (zh) * 2016-07-31 2018-02-08 赵晓丽 一种提醒手机应用降价的方法和提醒系统
CN110069732A (zh) * 2019-03-29 2019-07-30 腾讯科技(深圳)有限公司 一种信息展示的方法、装置及设备
CN110069732B (zh) * 2019-03-29 2022-11-22 腾讯科技(深圳)有限公司 一种信息展示的方法、装置及设备
CN110516030A (zh) * 2019-08-26 2019-11-29 北京百度网讯科技有限公司 意图词的确定方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
WO2015179556A1 (en) 2015-11-26
CN105095311B (zh) 2019-07-09
US20150339700A1 (en) 2015-11-26
TWI662495B (zh) 2019-06-11
TW201545091A (zh) 2015-12-01

Similar Documents

Publication Publication Date Title
CN105095311A (zh) 推广信息的处理方法、装置及系统
CN104750789B (zh) 标签的推荐方法及装置
CN108885623A (zh) 基于知识图谱的语意分析系统及方法
CN112508609B (zh) 人群扩量的预测方法、装置、设备及存储介质
CN111506801A (zh) 一种应用App中子应用的排序方法及装置
CN104090888A (zh) 一种用户行为数据的分析方法和装置
CN105447038A (zh) 用于获取用户特征的方法和系统
CN103336793A (zh) 一种个性化论文推荐方法及其系统
CN105069036A (zh) 一种信息推荐方法及装置
CN103823849A (zh) 词条的获取方法及装置
CN104281890A (zh) 电子商务系统中预测流行商品的方法和系统
CN103870001A (zh) 一种生成输入法候选项的方法及电子装置
CN108932625B (zh) 用户行为数据的分析方法、装置、介质和电子设备
CN104142990A (zh) 搜索方法及装置
CN103729365A (zh) 一种搜索方法和系统
US20180247247A1 (en) Method and system for search provider selection based on performance scores with respect to each search query
CN104361092A (zh) 搜索方法及装置
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN107133263A (zh) Poi推荐方法、装置、设备及计算机可读存储介质
CN104239335A (zh) 特定用户信息获取方法及装置
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
US20220129754A1 (en) Utilizing machine learning to perform a merger and optimization operation
CN113569118B (zh) 自媒体推送方法、装置、计算机设备及存储介质
CN105447004A (zh) 查询推荐词的挖掘、相关查询方法及装置
CN103262079B (zh) 检索装置及检索方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240325

Address after: # 01-21, Lai Zan Da Building 1, 51 Belarusian Road, Singapore

Patentee after: Alibaba Singapore Holdings Ltd.

Country or region after: Singapore

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands

TR01 Transfer of patent right