CN105808728B - 数据处理方法及装置 - Google Patents

数据处理方法及装置 Download PDF

Info

Publication number
CN105808728B
CN105808728B CN201610131196.7A CN201610131196A CN105808728B CN 105808728 B CN105808728 B CN 105808728B CN 201610131196 A CN201610131196 A CN 201610131196A CN 105808728 B CN105808728 B CN 105808728B
Authority
CN
China
Prior art keywords
keyword
data
behavior
indicator
behavioral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610131196.7A
Other languages
English (en)
Other versions
CN105808728A (zh
Inventor
吴博
宋艳
姜振
贾凯
孙天光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201610131196.7A priority Critical patent/CN105808728B/zh
Publication of CN105808728A publication Critical patent/CN105808728A/zh
Application granted granted Critical
Publication of CN105808728B publication Critical patent/CN105808728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种数据处理方法及装置。其中,数据处理方法包括:获取关键词用户操作日志和关键词主体操作日志;从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。本发明实施例的数据处理方法及装置,实现了通过挖掘并分析主体行为和用户行为,优选出准确性高的关键词,为优化广告创意提供技术依托,进而提高了广告投放效果。

Description

数据处理方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着通信技术的高速发展和互联网应用的全面普及,越来越多的商家利用搜索推广技术进行网络信息推广,并将推广信息、产品或服务呈现至更多的网络用户,以便利用网络来寻找大量潜在的客户,从而建立自己庞大的客户群。
商家在作为广告主进行网络信息推广过程中,通常使用广告创意展现广告的基本信息。广告创意的质量高低与广告的准确率和用户体验息息相关。现有的广告创意一般是由广告主或广告主的客服根据自身业务特征来选择或创建,通常也只是简单套用关键词插入规则,机械堆砌广告语,没有任何数据或技术作为依托,具有一定主观性,且准确性不高。使用这些主观性强且准确性不高的关键词对广告创意进行优化,势必会降低广告投放效果,导致用户体验不好。
发明内容
本发明的目的在于,提供一种数据处理方法及装置,以实现通过挖掘并分析主体行为和用户行为,优选出准确性高的关键词,为优化广告创意提供技术依托,进而提高广告投放效果。
根据本发明的一方面,提供一种数据处理方法,所述方法包括:获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据;从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
优选地,所述第一操作包括用户对关键词相关网页的点击操作和交易操作,所述第二操作包括主体对关键词的调价操作和编辑操作。
优选地,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据包括关键词的点击率数据和转化率数据,
所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据包括价格调整数据和编辑操作次数。
优选地,所述根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数的处理包括:
根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;
基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。
优选地,所述编辑操作次数包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
优选地,所述根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分的处理包括:
根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;
将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
优选地,所述根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词的处理包括:
根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;
根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;
从经排序的关键词中选取与所述第二操作相关度强的关键词。
优选地,所述根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据的处理包括:
对所述任一关键词,进行如下处理:
获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;
根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
根据本发明的另一方面,还提供一种数据处理装置,所述装置包括:日志获取模块,用于获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据;数据获取模块,用于从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;参数获取模块,用于根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;关键词选取模块,用于根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
优选地,所述第一操作包括用户对关键词相关网页的点击操作和交易操作,所述第二操作包括主体对关键词的调价操作和编辑操作。
优选地,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据包括关键词的点击率数据和转化率数据,
所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据包括价格调整数据和编辑操作次数。
优选地,所述参数获取模块包括:
评分计算单元,用于根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;
数据拟合单元,用于基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。
优选地,所述编辑操作次数包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
优选地,所述评分计算单元用于根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;
将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
优选地,所述关键词选取模块包括:
数据计算单元,用于根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;
关键词排序单元,用于根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;
关键词选取单元,用于从经排序的关键词中选取与所述第二操作相关度强的关键词。
优选地,所述数据计算单元用于对所述任一关键词,进行如下处理:获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
本发明实施例提供的数据处理方法及装置,通过从关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;进一步根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。从而实现了通过挖掘并分析主体行为和用户行为,优选出准确性高的关键词,为优化广告创意提供技术依托,进而提高了广告投放效果,提升了用户体验。
附图说明
图1是示出反映本发明的总体发明构思的一个示例的示意图;
图2是示出根据本发明实施例一的数据处理方法的流程图;
图3是示出根据本发明实施例二的数据处理装置的逻辑框图。
具体实施方式
本发明的基本构思是,提供一种基于主体行为和用户对关键词的操作行为的数据处理方法:在获取关键词用户操作日志和关键词主体操作日志之后,从关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从关键词主体操作日志分别获取至少一个关键词的第二行为指标统计数据;进一步根据第一行为指标统计数据和第二行为指标统计数据分别获取关于至少一个关键词的第二操作对用户行为的行为影响参数,由此,可以根据行为影响参数从主体关键词数据库选取与第二操作相关度强的关键词。
图1是示出反映本发明的总体发明构思的一个示例的示意图。
参照图1,以广告数据为例,首先,获取到广告主(在相关网站上做产品、服务等信息推广的商家)行为日志和用户对拍卖词的行为日志,其次,从广告主行为日志中抽取广告主对拍卖词的调价行为(如调高价格行为、调低价格行为)和操作行为(添加、删除等针对拍卖词的编辑操作),从用户对拍卖词的行为日志中抽取拍卖词特征指标(如点击率、转化率);再次,分析调价行为与拍卖词指标特征的关系,以及分析操作行为与拍卖词指标特征的关系;最后,根据分析结果从数据库(包含大量指标特征未知的拍卖词)中选取高质量的拍卖词。
可见,本发明综合考虑了广告主行为和用户对拍卖词的行为,通过对上述行为日志进行数据挖掘和分析,依据分析结果选取既满足广告主的投资需求又精确匹配用户搜索需求的拍卖词,从而用选取的拍卖词去修改完善广告主的创意,使得广告高效、准确地到达用户,进而提高广告投放效果,提升用户体验。
实施例一
图2是示出根据本发明实施例一的数据处理方法的流程图。可在广告服务器上执行所述方法。
参照图2,在步骤S210,获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据。
这里,所述第一操作包括用户对关键词相关网页的点击操作和交易操作,所述第二操作包括主体对关键词的调价操作和编辑操作。
在实际应用中,以广告主为例,为了做产品、服务等信息推广,广告主会向搜索引擎提供商购买一些关键词如“鲜花”等,购买之后可对购买的关键词进行调价、编辑等行为操作。例如,调高关键词“鲜花”的价格。再比如,删除关键词“鲜花”,启用关键词“鲜花”等等。并且,多个广告主可都购买了同一关键词。假设用户在搜索引擎键入这些广告主购买的关键词进行搜索,如果对某个广告主的推广信息感兴趣,那么,该用户会点击关键词相关网页,也可以跟广告主发生进一步地交易操作。由此,广告服务器可获得充足的关键词用户操作日志和关键词主体操作日志,为后续的数据挖掘和数据分析打下基础。
在步骤S220,从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据。
需要说明的是,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据可包括关键词的点击率数据和转化率数据,所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据可包括价格调整数据和编辑操作次数。
也就是说,在获得了关键词用户操作日志和关键词主体操作日志之后,可对前述日志记录进行数据挖掘,得到针对关键词的点击率数据和转化率数据,以及价格调整数据和编辑操作次数。
在步骤S230,根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数。
根据本发明的示例性实施例,步骤S230可包括:根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。这里,所述编辑操作次数可包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
其中,上述根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分的处理可包括:根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
在具体的实现方式中,可通过下式(1)、式(2)和式(3)执行上述根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数的处理,具体如下:
1/(1+exp(-Δbid/bid))=k1*ratio_1∧t1*ratio_2∧t2+b1……………………式(1)
其中,bid为调价前的关键词的价格,Δbid为调价前与调价后之间的关键词的价格差值,ratio_1为关键词的点击率,ratio_2为关键词的转化率,k1和b1均为线性调权系数,t1和t2均为指数调权系数。
score=k2*ratio_1∧t3*ratio_2∧t4+b2…………………………………………式(2)
其中,score为编辑操作评分,ratio_1为关键词的点击率,ratio_2为关键词的转化率,k2和b2均为线性调权系数,t3和t4均为指数调权系数。sum(label_action)为对关键词执行编辑操作的预设值的和值,执行一次“添加”或“启用”的预设值为“+1”,执行一次“删除”或“暂停”的预设值为“-1”,sum(number_action)为关键词的编辑操作的总数量。
也就是说,将经过前述步骤S220挖掘出的关键词的点击率数据和转化率数据,以及价格调整数据和编辑操作次数,代入式(1)、式(2)和式(3)中,从而计算出公式中的调权系数,即k1、b1、k2、b2、t1、t2、t3和t4。由此,体现调价行为与拍卖词指标特征的关系式,以及分析操作行为与拍卖词指标特征的关系式就建立好了,为后续优质关键词选取提供技术依据。
在步骤S240,根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
根据本发明的示例性实施例,步骤S240可包括:根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;从经排序的关键词中选取与所述第二操作相关度强的关键词。
其中,上述根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据的处理可包括:对所述任一关键词,进行如下处理:获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
在实际应用中,对于一些没有点击率和转化率等相关数据的关键词,比如“鲜花速递”、“礼物”、“百合花”等。这些关键词的价格调整数据和编辑操作次数是已知,此时需要对这些关键词进行合理的有技术依据的评判,判断其是否为优质的关键词。关键词是否优质主要是看关键词带来的点击率和转化率,那么,就可将关键词的价格调整数据和编辑操作次数代入已知了调权系数的式(1)、式(2)和式(3)中,通过行为反解方程求解出每个关键词的点击率和转化率,从而通过点击率和转化率的乘积排序选出优质的关键词。因此,使用选取出的优质的关键词来用于广告主优化广告创意,可直接影响广告的相关性,影响到用户对广告的行为以及用户体验度。
本发明实施例提供的数据处理方法,通过从关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;进一步根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。从而实现了通过挖掘并分析主体行为和用户行为,优选出准确性高的关键词,为优化广告创意提供技术依托,进而提高了广告投放效果,提升了用户体验。
实施例二
图3是示出根据本发明实施例二的数据处理装置的逻辑框图。可用于执行如图2所示实施例的方法步骤。
参照图3,数据处理装置包括日志获取模块310、数据获取模块320、参数获取模块330和关键词选取模块340。
日志获取模块310用于获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据。
这里,所述第一操作可包括用户对关键词相关网页的点击操作和交易操作,所述第二操作可包括主体对关键词的调价操作和编辑操作。
数据获取模块320用于从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据。
优选地,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据可包括关键词的点击率数据和转化率数据,
所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据可包括价格调整数据和编辑操作次数。
参数获取模块330用于根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数。
具体地,所述参数获取模块330可包括:
评分计算单元(未示出)用于根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;
数据拟合单元(未示出)用于基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。
需要说明的是,所述编辑操作次数可包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
相应地,所述评分计算单元可用于根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;
将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
关键词选取模块340用于根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
具体地,所述关键词选取模块340可包括:
数据计算单元(未示出)用于根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;
关键词排序单元(未示出)用于根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;
关键词选取单元(未示出)用于从经排序的关键词中选取与所述第二操作相关度强的关键词。
优选地,所述数据计算单元可用于对所述任一关键词,进行如下处理:获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
本发明实施例提供的数据处理装置,通过从关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;进一步根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。从而实现了通过挖掘并分析主体行为和用户行为,优选出准确性高的关键词,为优化广告创意提供技术依托,进而提高了广告投放效果,提升了用户体验。
需要指出,根据实施的需要,可将本申请中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明的目的。
上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种数据处理方法,其特征在于,所述方法包括:
获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据;
从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;
根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;
根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
2.根据权利要求1所述的方法,其特征在于,所述第一操作包括用户对关键词相关网页的点击操作和交易操作,所述第二操作包括主体对关键词的调价操作和编辑操作。
3.根据权利要求2所述的方法,其特征在于,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据包括关键词的点击率数据和转化率数据,
所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据包括价格调整数据和编辑操作次数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数的处理包括:
根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;
基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。
5.根据权利要求4所述的方法,其特征在于,所述编辑操作次数包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
6.根据权利要求5所述的方法,其特征在于,所述根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分的处理包括:
根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;
将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
7.根据权利要求1~6中任一项所述的方法,其特征在于,所述根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词的处理包括:
根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;
根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;
从经排序的关键词中选取与所述第二操作相关度强的关键词。
8.根据权利要求7所述的方法,其特征在于,所述根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据的处理包括:
对所述任一关键词,进行如下处理:
获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;
根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
9.一种数据处理装置,其特征在于,所述装置包括:
日志获取模块,用于获取关键词用户操作日志和关键词主体操作日志,所述关键词用户操作日志包括关于用户对关键词执行第一操作的数据,所述关键词主体操作日志包括关于主体对关键词执行第二操作的数据;
数据获取模块,用于从所述关键词用户操作日志分别获取至少一个关键词的第一行为指标统计数据,并且从所述关键词主体操作日志分别获取所述至少一个关键词的第二行为指标统计数据;
参数获取模块,用于根据所述第一行为指标统计数据和第二行为指标统计数据分别获取关于所述至少一个关键词的第二操作对用户行为的行为影响参数;
关键词选取模块,用于根据所述行为影响参数从主体关键词数据库选取与所述第二操作相关度强的关键词。
10.根据权利要求9所述的装置,其特征在于,所述第一操作包括用户对关键词相关网页的点击操作和交易操作,所述第二操作包括主体对关键词的调价操作和编辑操作。
11.根据权利要求10所述的装置,其特征在于,所述从所述关键词用户操作日志分别获取的至少一个关键词的第一行为指标统计数据包括关键词的点击率数据和转化率数据,
所述从所述关键词主体操作日志分别获取的所述至少一个关键词的第二行为指标统计数据包括价格调整数据和编辑操作次数。
12.根据权利要求11所述的装置,其特征在于,所述参数获取模块包括:
评分计算单元,用于根据所述编辑操作次数分别计算所述至少一个关键词的编辑操作评分;
数据拟合单元,用于基于线性回归拟合所述至少一个关键词的价格调整数据、编辑操作评分以及点击率数据和转化率数据,分别计算得到所述至少一个关键词的第二操作对用户行为的行为影响参数。
13.根据权利要求12所述的装置,其特征在于,所述编辑操作次数包括以下至少一个编辑操作的数量:添加、启用、删除和暂停。
14.根据权利要求13所述的装置,其特征在于,所述评分计算单元用于根据所述编辑操作次数分别统计所述至少一个关键词的编辑操作的总数量,并分别计算对所述至少一个关键词执行至少一个编辑操作的预设值的和值,其中对所述至少一个关键词执行一次“添加”或“启用”的预设值为“+1”,对所述至少一个关键词执行一次“删除”或“暂停”的预设值为“-1”;
将对所述至少一个关键词执行至少一个编辑操作的预设值的和值与所述编辑操作的总数量之间的比值,作为所述至少一个关键词的编辑操作评分。
15.根据权利要求9~14中任一项所述的装置,其特征在于,所述关键词选取模块包括:
数据计算单元,用于根据所述行为影响参数计算所述主体关键词数据库中任一关键词的点击率数据和转化率数据;
关键词排序单元,用于根据所述点击率数据和所述转化率数据的乘积对所述主体关键词数据库中的关键词进行排序;
关键词选取单元,用于从经排序的关键词中选取与所述第二操作相关度强的关键词。
16.根据权利要求15所述的装置,其特征在于,所述数据计算单元用于对所述任一关键词,进行如下处理:获取所述关键词的第一行为指标统计数据和第二行为指标统计数据;根据所述第一行为指标统计数据、所述第二行为指标统计数据以及所述行为影响参数,计算得到所述关键词的点击率数据和转化率数据。
CN201610131196.7A 2016-03-08 2016-03-08 数据处理方法及装置 Active CN105808728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610131196.7A CN105808728B (zh) 2016-03-08 2016-03-08 数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610131196.7A CN105808728B (zh) 2016-03-08 2016-03-08 数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN105808728A CN105808728A (zh) 2016-07-27
CN105808728B true CN105808728B (zh) 2019-02-22

Family

ID=56467833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610131196.7A Active CN105808728B (zh) 2016-03-08 2016-03-08 数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN105808728B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205572A (zh) * 2016-12-20 2018-06-26 百度在线网络技术(北京)有限公司 一种搜索方法、装置及设备
CN108241643B (zh) * 2016-12-23 2021-12-24 北京国双科技有限公司 关键词的指标数据分析方法及装置
CN109727052A (zh) * 2017-10-31 2019-05-07 北京国双科技有限公司 关键词确定方法及装置
CN110347900B (zh) * 2019-07-10 2022-12-27 腾讯科技(深圳)有限公司 一种关键词的重要度计算方法、装置、服务器及介质
CN110659768B (zh) * 2019-08-14 2023-01-17 中国科学院计算机网络信息中心 一种数据出版物学术影响力评价预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078591A1 (en) * 2007-12-14 2009-06-25 Nhn Corporation Method for providing keyword advertisement based on user conversion and system for executing the method
CN103593350A (zh) * 2012-08-14 2014-02-19 阿里巴巴集团控股有限公司 一种推荐推广关键词价格参数的方法和装置
CN104331823A (zh) * 2014-11-19 2015-02-04 北京奇虎科技有限公司 确定发布信息中关键词保留价格的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9690847B2 (en) * 2014-08-07 2017-06-27 Google, Inc. Selecting content using query-independent scores of query segments

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009078591A1 (en) * 2007-12-14 2009-06-25 Nhn Corporation Method for providing keyword advertisement based on user conversion and system for executing the method
CN103593350A (zh) * 2012-08-14 2014-02-19 阿里巴巴集团控股有限公司 一种推荐推广关键词价格参数的方法和装置
CN104331823A (zh) * 2014-11-19 2015-02-04 北京奇虎科技有限公司 确定发布信息中关键词保留价格的方法及装置

Also Published As

Publication number Publication date
CN105808728A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN105808728B (zh) 数据处理方法及装置
US10789311B2 (en) Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium
US11941660B1 (en) Conversion path performance measures and reports
CN105765573B (zh) 网站通信量优化方面的改进
US9152691B2 (en) System and method for performing set operations with defined sketch accuracy distribution
US8321448B2 (en) Click-through log mining
US9430519B1 (en) Dynamically generating pre-aggregated datasets
US20080306819A1 (en) System and method for shaping relevance scores for position auctions
US20140304066A1 (en) System and method for behavioral segment optimization based on data exchange
CN103136696A (zh) 媒体投放管理方法及其系统
US20080288347A1 (en) Advertising keyword selection based on real-time data
CN102663519A (zh) 网络广告投放中媒体选择的优化系统及方法
CN107229730A (zh) 数据查询方法及装置
TW201243628A (en) Determination of recommendation data
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
US20160189218A1 (en) Systems and methods for sponsored search ad matching
US20180096067A1 (en) Creation and optimization of resource contents
CN104951460A (zh) 基于关键词聚类的排名参量值确定方法及装置
US20120260185A1 (en) Path length selector
CN103942268A (zh) 搜索与应用相结合的方法、设备以及应用接口
CN103020289B (zh) 一种基于日志挖掘的搜索引擎用户个性化需求提供方法
WO2018144048A1 (en) Gain adjustment component for computer network routing infrastructure
CN112749863A (zh) 关键词的调价方法及装置、电子设备
CN108304570B (zh) 一种搜索结果的处理方法及展现方法、服务器、客户端
CN103020083A (zh) 需求识别模板的自动挖掘方法、需求识别方法及对应装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant