CN103530789A - 一种用于确定重点索引词的方法、装置和设备 - Google Patents

一种用于确定重点索引词的方法、装置和设备 Download PDF

Info

Publication number
CN103530789A
CN103530789A CN201210229104.0A CN201210229104A CN103530789A CN 103530789 A CN103530789 A CN 103530789A CN 201210229104 A CN201210229104 A CN 201210229104A CN 103530789 A CN103530789 A CN 103530789A
Authority
CN
China
Prior art keywords
index terms
information
user
importance degree
advertising message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210229104.0A
Other languages
English (en)
Other versions
CN103530789B (zh
Inventor
吴梓栋
宋铭
徐惠
余昌远
徐勇明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210229104.0A priority Critical patent/CN103530789B/zh
Publication of CN103530789A publication Critical patent/CN103530789A/zh
Application granted granted Critical
Publication of CN103530789B publication Critical patent/CN103530789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的目的是提供一种用于确定重点索引词的方法、装置和设备。其中,本发明中获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;根据多个索引词的展现重要度信息及用户重要度信息,从多个索引词中确定至少一个重点索引词;其中,确定一个索引词的展现重要度信息的方法为获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息,接着根据所述排序位置信息,获得该索引词的展现重要度信息;确定一个索引词的用户重要度信息的方法为获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息,根据出现频度信息,确定该索引词的用户重要度信息。

Description

一种用于确定重点索引词的方法、装置和设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种用于确定重点索引词的方法与装置。
背景技术
随着互联网技术的快速发展,在网络中进行广告投放的需求也持续增长。现有的广告投放方案一般为:用户,如广告主,在进行广告投放时首先选择多个索引词,且其选择的一个索引词指向一条网络广告,则在普通网络用户通过输入查询序列来进行搜索时,将查询序列能够匹配的索引词指向的网络广告提供给普通网络用户,从而实现广告投放。
由此可见,为使普通网络用户能够获取符合其需求的广告信息,索引词十分重要。特别地,若能根据用户选择的索引词确定重点索引词,有助于通过改善重点索引词所指向的广告信息的位置,来基于用户输入的输入序列向用户提供更符合其需求的广告信息。
然而,现有技术中,仅能依靠用户按照其经验来判断其选择的所有索引词中,哪些索引词为更加重要的重点索引词。该种人工判断的方式较为主观,无法较为准确地确定重点索引词。因此,基于该种主观判断所确定的重点索引词进行的广告位置调整,往往难以满足普通网络用户对广告信息的获取需求。因而,确定重点索引词十分重要。
发明内容
本发明的目的是提供一种用于确定重点索引词的方法与装置。
根据本发明的一个方面,提供了一种用于确定重点索引词的方法,该方法包括以下步骤:
a获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;
b将所述多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词;
其中,一个索引词的展现重要度信息通过以下步骤来确定:
i1获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;
i2根据所述排序位置信息,获得该索引词的展现重要度信息;
其中,一个索引词的用户重要度信息通过以下步骤来确定:
x1获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;
x2根据所述出现频度信息,确定该索引词的用户重要度信息。
根据本发明的另一方面,还提供了一种用于确定重点索引词的确定设备,该确定设备包括:
重要度获取装置,用于获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;
重点索引词确定装置,用于将所述多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词;
其中,该确定装置还包括第一重要度确定装置,用于确定一个索引词的展现重要度信息,
其中,所述第一重要度确定装置包括:
排序位置获取装置,用于获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;
展现重要度获取装置,用于根据所述排序位置信息,获得该索引词的展现重要度信息;
其中,该确定装置还包括第二重要度确定装置,用于确定一个索引词的用户重要度信息;
其中,所述第二重要度确定装置包括:
频度获取装置,用于获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;
用户重要度确定装置,用于根据所述出现频度信息,确定该索引词的用户重要度信息。
与现有技术相比,本发明具有以下优点:1)通过根据用户选择的一个索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息来确定该索引词的展现重要度信息,实现了从广告展现角度的多个数据分类的多维度出发,对该索引词的用户历史相关数据基于不同维度进行排序分析,使得所获取的该索引词的展现重要度信息能够完整且准确地反映该索引词所指向广告的展现效果,为进一步从多个索引词中准确地确定重点索引词提供有力保证;2)通过分析对一个索引词进行切词处理后得到的切词片段在两类索引词集合的范围内的出现频度,从而确定该索引词的用户重要度信息,能够使获得的该用户重要度信息全面地反映该用户、所有其他用户、及/或其与该用户属于同一用户分类的其他用户对该索引词的重视程度,也在一定程度反映了该索引词符合用户投放需求的程度,为进一步从多个索引词中准确地确定重点索引词提供有力保证;3)将用户选择的多个索引词的展现重要度信息及用户重要度信息相结合,来从该多个索引词中确定至少一个重点索引词,实现了从多个索引词的展现效果角度和用户需求角度出发精确地确定其中的重点索引词,实现了确定重点索引词的客观性和准确性,使得所确定的重点索引词能够保证既包括在广告投放过程中的展现效果较好的索引词,又包括用户重视度较高的索引词;4)进一步,根据重点索引词所指向的广告信息的当前状态信息,生成能够提升该广告信息在被展现时所处的展现位置信息的优化建议,进而满足用户的广告投放需求,提高广告信息的普通网络用户接受度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明一个方面的用于确定重点索引词的确定装置的结构示意图;
图2示出根据本发明一个优选实施例的用于确定重点索引词的确定装置的结构示意图;
图3示出根据本发明另一个优选实施例的用于确定重点索引词的确定装置的结构示意图;
图4示出根据本发明另一个方面的用于确定重点索引词的方法流程图;
图5示出根据本发明一个优选实施例的用于确定重点索引词的方法流程图;
图6示出根据本发明另一个优选实施例的用于确定重点索引词的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出本发明一个方面的用于确定重点索引词的确定装置的结构示意图。本实施例的确定装置包含于计算机设备中;该确定装置包括第一重要度确定装置1、第二重要度确定装置2、重要度获取装置3和重点索引词确定装置4,其中,第一重要度确定装置1包括排序位置获取装置11和展现重要度获取装置12,第二重要度确定装置2包括频度获取装置21和用户重要度确定装置22。
其中,所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件可包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述计算机设备包括但不限于个人计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
本领域技术人员应能理解上述计算机设备仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
本发明中,一个用户可选择多个索引词,其中,用户选择的每个索引词均指向该用户的一个广告。此外,多个用户可选择相同的索引词,也即,一个索引词可指向多个用户的多个广告。
本发明的第一重要度确定装置1确定用户选择的多个索引词中的一个索引词的展现重要度信息。
具体地,第一重要度确定装置1获取一个索引词的展现重要度信息的方式包括但不限于:
第一重要度确定装置1包含的排序位置获取装置11获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;展现重要度获取装置12根据所述排序位置信息,获得该索引词的展现重要度信息。
更具体地,对于每个数据分类,排序位置获取装置11对属于该数据分类的用户历史相关数据进行排序,并获得需要处理的一个索引词的各个用户历史相关数据分别在其所属数据分类下的排序位置信息;接着,展现重要度获取装置12将该一个索引词在各个数据分类中的排序位置信息进行诸如求和、求取平方和等计算,以获得该一个索引词的展现重要度。
其中,所述属于多个数据分类的用户历史相关数据包括但不限于以下至少一项:
1)该用户的广告信息中被该索引词指向的广告信息的广告点击量;其中,该广告点击量可包括在预定历史时间段内被该索引词指向的广告信息的广告点击量。
2)该用户的广告信息中被该索引词指向的广告信息产生的消费数额;其中,该消费数额可包括在预定历史时间段内被该索引词指向的广告信息产生的消费数额。
3)该用户的广告信息中被该索引词指向的广告信息的重点位置展现次数;其中,所述重点位置意指网民关注度较高的搜索结果页面位置,例如,通过自然搜索获取的自然搜索结果展示于页面左侧位置,则网民关注度较高的搜索结果页面位置在页面左侧位置,该页面左侧位置为重点位置;所述重点位置展现次数可包括在预定历史时间段内被该索引词指向的广告信息的重点位置展现次数。
4)该用户的广告信息中被该索引词指向的广告信息的重点位置展现率;其中,该重点位置展现率包括在预定历史时间段内被索引词指向的广告信息的重点位置展现次数与该广告信息的全部展现次数的比值。
5)该用户的广告信息中被该索引词指向的广告信息在该索引词指向的所有广告中的展现排位;其中,所述展现排位可包括在预定历史时间段内被该索引词指向的广告信息在该索引词指向的所有广告中的平均展现排位。
6)选择该索引词的所有用户对该索引词的操作次数;其中,所述操作包括但不限于:对索引词的出价信息的调整操作、对索引词投放时段信息的调整操作等;所述操作次数可为在预定历史时间段内选择该索引词的所有用户对该索引词的操作次数。
7)选择该索引词的其他用户的用户数量。
在一示例中,用户选择的四个索引词分别为Q1、Q2、Q3和Q4,且多个数据分类包括用户历史相关数据中被该用户选择的一个索引词指向的广告信息的广告点击量T、该广告信息产生的消费数额C及该广告信息的重点位置展现次数S;当第一重要度确定装置1需要获取索引词Q1的展现重要度信息时,首先,排序位置获取装置11从本地的历史数据信息库中或从第三方设备中获取得到该四个索引词关键词属于该三个数据分类的用户历史相关数据;接着,对于每个数据分类,排序位置获取装置11对该四个索引词关键词属于该数据分类的用户历史相关数据按照从小到大的顺序进行排序,并获得Q1的各个用户历史相关数据分别在其所属数据分类下的排序位置信息;如下表1所示:
表1:
Figure BDA00001845474600071
接着,展现重要度获取装置12将Q1在该三个数据分类中的排序位置信息3、4、2,进行求和计算,以获得Q1的展现重要度=3+4+2=9,即第一重要度获取装置1获取Q1的展现重要度为9。
在另一示例中,排序位置获取装置11已预先完成排序操作并获得如表1所示的排序位置信息,则当需要获取索引词Q1的展现重要度信息时,展现重要度获取装置12直接根据表1中所示的排序位置信息,获得Q1的展现重要度。
在此,需要说明的是,上述举例中的各项数值仅为说明作用的示例,以供读者理解本发明,并非实际应用时的真实数据,不应视为对本专利申请保护范围的任何限制。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取一个索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息,并根据所述排序位置信息,获得该索引词的展现重要度信息的实现方式,均应包含在本发明的范围内。
通过根据用户选择的一个索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息来确定该索引词的展现重要度信息,实现了从广告展现角度的多个数据分类的多维度出发,对该索引词的用户历史相关数据基于不同维度进行排序分析,使得获取的该索引词的展现重要度信息能够完整且准确地反映该索引词与其他用户选择的索引词相比其指向广告的展现效果,为进一步从多个索引词中准确地确定重点索引词提供有力保证。
优选地,展现重要度获取装置12包括第一子获取装置(图未示),该第一子获取装置基于所述各个数据分类的分类权重,对排序位置获取装置11获取的该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息。
在一示例中,接上例,排序位置获取装置11已获取的索引词Q1在三个数据分类T、C和S中的排序位置信息分别为3、4、2,且预定的的该三个数据分类T、C和S分别对应的分类权重为1.5、2和1,则展现重要度获取装置12根据该三个分类权重对其分别对应的排序位置信息进行加权计算,获得Q1的展现重要度信息=3×1.5+4×2+2×1=14.5。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述各个数据分类的分类权重,对该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息的实现方式,均应包含在本发明的范围内。
考虑到不同数据分类中的用户历史相关数据在确定索引词的展现重要度时具有不同程度的影响,因此引入分类权重对索引词分别在各个数据分类中的排序位置信息进行加权,能够获得更为准确的展现重要度信息。
本发明的第二重要度确定装置2确定一个索引词的用户重要度信息。
具体地,第二重要度获取装置2获取用户重要度信息的方式包括但不限于:
第二重要度获取装置2包含的频度获取装置21获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;用户重要度确定装置22根据所述出现频度信息,确定该索引词的用户重要度信息。
其中,所述其他用户可包括除该用户之外的全部其他用户,也可包括与该用户属于同一用户分类的其他用户。
更具体地,首先,频度获取装置21通过切词算法对该索引词进行切词处理,以获得该索引词的至少一个切词片段,并获取该至少一个切词片段在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;其中,前述切词算法包括但不限于正向最大匹配,反向最大匹配,双向最大匹配,语言模型方法,最短路径算法等。
优选地,频度获取装置21获取出现频度信息的方式包括但不限于:
1)频度获取装置21获取该至少一个切词片段在该用户选择的索引词中的出现频度信息,作为该至少一个切词片段的出现频度信息;
2)频度获取装置21获取将该至少一个切词片段在该用户与其他用户选择的索引词中的出现频度信息,作为该至少一个切词片段的出现频度信息;
3)频度获取装置21获取该至少一个切词片段在该用户选择的索引词中的出现频度信息,及将该至少一个切词片段在该用户与其他用户选择的索引词中的出现频度信息,并对上述两个出现频度信息进行平均值计算,将平均值计算结果作为该至少一个切词片段的出现频度信息。
随后,用户重要度确定装置22根据频度获取装置21获取的该至少一个切词片段的出现频度信息,将该至少一个切词片段的出现频度信息进行诸如求和、求取平方和等计算,并将计算结果以作为该索引词的用户重要度信息。
在一示例中,用户选择的三个索引词分别为Q5“鼻炎怎么治疗”、Q6“鼻炎治疗方法”和Q7“鼻炎治疗”,当第二重要度确定装置2需要获取索引词Q6的用户重要度信息时,首先,频度获取装置21通过切词算法对Q6进行切词处理,以获得三个切词片段f1“鼻炎”、f2“治疗”和f3“方法”;接着,频度获取装置21通过例如字符串匹配等的匹配方式,将该三个切词片段分别在该用户选择的索引词Q5、Q6及Q7中进行匹配查询,以获取f1、f2及f3的出现频度信息分别为0.375、0.375、0.125;随后,用户重要度确定装置22对已获取的f1、f2及f3的出现频度信息进行求和计算,以确定Q5的用户重要度信息=0.375+0.375+0.125=0.875。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息,接着根据所述出现频度信息确定该索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
通过分析对一个索引词进行切词处理后得到的切词片段在两类索引词集合的范围内的出现频度,从而确定该索引词的用户重要度信息,能够使获得的该用户重要度信息全面地反映该用户,所有其他用户,及/或其与该用户属于同一用户分类的其他用户对该索引词的重视程度,也在一定程度反映了该索引词符合用户投放需求的程度,为进一步从多个索引词中准确地确定重点索引词提供有力保证。
优选地,用户重要度确定装置22包括第二子获取装置(图未示),该第二子获取装置将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息。
其中,所述组成结构类型意指索引词的句子或短语的结构类型,如疑问句类型、陈述句类型、主谓短语类型、动宾短语类型等。
在一示例中,接上例,频度获取装置21获取索引词Q5“鼻炎怎么治疗”的三个切词片段f1、f2及f3的出现频度信息分别为0.375、0.375、0.125,且预确定的组成结构类型的类型权重分别为疑问句类型权重为4、陈述句类型1、主谓短语类型1.5、动宾短语类型2;第二子获取装置对Q5通过例如自然语言分析的方式对Q5进行分型分析,确定其为疑问句类型,则将该疑问句类型权重4加权给Q5的切词片段f1、f2及f3的出现频度信息,以确定Q5的用户重要度信息=4×(0.3754+0.375+0.125)=3.5;优选地,所述自然语言分析可通过OpenNLP、FudanNLP、Standford NLP、语言技术平台(LTP)等自然语言处理工具来实现。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
由于对于不同的组成结构类型,投放广告的用户和普通网络网民会产生不同的关注度,例如,更多的投放广告的用户习惯选择疑问句类型的索引词,且更多的普通网络用户在搜索时习惯输入疑问句类型的查询序列,因此将组成结构类型的类型权重加权给切词片段的出现频度信息,能够获取更为准确的用户重要度信息。
更优选地,所述第二子获取装置包括第三子获取装置(图未示),该第三子获取装置将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段的预确定的切词权重,确定所述索引词的用户重要度信息。
在一示例中,接上例,频度获取装置21获取索引词Q5“鼻炎怎么治疗”的三个切词片段f1、f2及f3的出现频度信息分别为0.375、0.375、0.125,预确定的组成结构类型的类型权重分别为疑问句类型权重为4、陈述句类型1、主谓短语类型1.5、动宾短语类型2,且预确定的f1的切词权重为1.5、f2的切词权重为1及f3的切词权重为0.8;首先,第二子获取装置对Q5通过自然语言分析以确定其为疑问句,则将该疑问句类型权重4加权给Q5的切词片段f1、f2及f3的出现频度信息,并结合该三个切词片段的预确定的切词权重,以确定Q5的用户重要度信息为=4×(0.3754×1.5+0.375×1+0.125×0.8)=4.15。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段与预确定的切词权重,确定所述索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
由于索引词切分后获得切词片度在该索引词中的重要度不同,因此引入切词片度的切词权重来对用户重要度信息进行调优,能够进一步调整获取的用户重要度信息的准确度。
本实施例的上述内容已说明如何获得展现重要度信息以及用户重要度信息,以下将叙述如何基于展现重要度信息以及用户重要度信息,选择重点索引词。
本发明的重要度获取装置3获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息、
具体地,作为一种优选方案(图未示),重要度获取装置3包括第一重要度确定装置1和第二重要度确定装置2,并且,通过第一重要度确定装置1中的排序位置获取装置11和展现重要度获取装置12的操作,重要度获取装置3获取用户选择的多个索引词各自的展现重要度信息,并通过第二重要度确定装置2中频度获取装置21和用户重要度确定装置22的操作,重要度获取装置3获取用户选择的多个索引词各自的用户重要度信息。
作为另一优选方案,如图1所示,第一重要度确定装置1和第二重要度确定装置2与重要度获取装置3相独立,并在重要度获取装置3之前执行操作;则重要度获取装置3可获取第一重要度确定装置1和第二重要度确定装置2在其执行操作之前已预确定的用户选择的多个索引词各自的展现重要度信息及用户重要度信息,例如,重要度获取装置3可获取已预存在网络数据库中的用户选择的多个索引词各自的展现重要度信息及用户重要度信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息的实现方式,均应包含在本发明的范围内。
接着,重点索引词确定装置4根据重要度获取装置3获取的多个索引词的展现重要度信息及用户重要度信息,从所述多个索引词中确定至少一个重点索引词。
具体地,重点索引词确定装置4确定至少一个重点索引词的方式包括但不限于:
1)将重要度获取装置3获取的多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词。
例如,重点索引词确定装置4将多个索引词中展现重要度信息大于预定的展现重要度阈值,且用户重要度信息大于的预定的用户重要度阈值的至少一个索引词,作为重点索引词。
又例如,重点索引词确定装置4将多个索引词中展现重要度信息大于预定的展现重要度阈值,或用户重要度信息大于的预定的用户重要度阈值的至少一个索引词,作为重点索引词。
3)重点索引词确定装置4根据展现重要度信息及用户重要度信息,确定一个用于评价索引词重要度的重要度评价值,并将重要度评价值超过预定重要度阈值的索引词,作为重点索引词。
例如,重点索引词确定装置4先将各个索引词的展现重要度信息及用户重要度信息进行归一化处理,再对归一化处理后的值求取平均值,并将平均值超过预定重要度阈值的索引词,作为重点索引词。
其中,需要说明的事,展现重要度信息大于预定的展现重要度阈值的确定重点索引词的标准是针对用户历史数据信息按照从小到大的顺序进行排序;当用户历史数据信息按照从大到小的顺序进行排序时,确定重点索引词的标准为展现重要度信息小于预定的展现重要度阈值。
需要说明的是,上r述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词的实现方式,均应包含在本发明的范围内。
将用户选择的多个索引词的展现重要度信息及用户重要度信息相结合,来从该多个索引词中确定至少一个重点索引词,实现了从多个索引词的展现效果角度和用户需求角度出发精确地确定其中的重点索引词,实现了确定重点索引词的客观性和准确性,使得所确定的重点索引词能够保证既包括在广告投放过程中的展现效果较好的索引词,又包括用户重视度较高的索引词。
图2示出根据本发明一个优选实施例的用于确定重点索引词的确定装置的结构示意图。本实施例中的该确定装置还包括第一确定装置5、第二确定装置6和调整装置7。
本实施例中,确定装置通过与多个用户的交互操作,将已确定的重点索引词提供至该多个用户,并获取该多个用户对提供至其的重点索引词的更新操作。
接着,第一确定装置5根据该多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词。优选地,所述更新操作的操作类型包括但不限于添加操作、删除操作等。
在一示例中,确定装置通过与多个用户的交互操作,将已确定的重点索引词K1、K2、K3、K4、K5提供至该多个用户,并获取该多个用户均对K1和K3执行的删除操作,则第一确定装置5确定被执行删除操作相同的重点索引词为K1和K3。
随后,第二确定装置6根据第一确定装置5确定的多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,其中,该相似特征信息包括所述多个重点索引词之间包含的相同或相似的切词片段,多个重点索引词之间相同或相似的组成结构类型,和/或,所述多个重点索引词之间具有相似性的用户历史相关数据所属的至少一个数据分类。
例如,当确定被执行删除操作相同的两个索引词分别为K6“鼻炎怎么治疗”和K7“鼻炎治疗方法”时,且已切分得到该两个重点索引词之间包含的相同切词片段为f1“鼻炎”和f2“治疗”,则第二确定装置6确定该两个切词片段f1和f2为该两个重点索引词之间的相似特征信息。
又例如,当确定被执行添加操作相同的两个索引词分别为K6“鲜花预定”和K7“鲜花快递”,第二确定装置6对该两个索引词进行自然语言分析,确定K6和K7的组成结构类型均为主谓短语,则第二确定装置6确定主谓短语为该两个重点索引词之间的相似特征信息。
再例如,当确定被执行删除操作相同的重点索引词为K1和K3时,第二确定装置6对该两个重点索引词的用户历史相关数据进行相似特征分析,确定K1和K3指向的多个用户的广告信息中被该两个重点索引词指向的广告信息的广告点击量均小于预定点击阈值,则将K1和K3的指向的广告信息的广告点击量作为其之间的相似度特征信息。
随后,调整装置7根据第二确定装置6确定的相似度特征信息,调整该(等)相同或者相似的切词片段的切词权重,该(等)相同或相似的组成结构类型的类型权重,和/或,该(等)具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重。
优选地,调整装置7调整切词片段的切词权重,组成结构类型的类型权重,和/或,数据分类的分类权重的方式包括但不限于:
1)均被执行添加操作的多个重点索引词的相似度特征信息为均包括一个或多个相同或者相似的片段信息,则调整装置7将该(等)相同或者相似的切词片段的切词权重调高预定数值或调高至预定切分权重;或者,均被执行删除操作的多个重点索引词的相似度特征信息为均包括一个或多个相同或者相似的片段信息,则调整装置7将该(等)相同或者相似的切词片段的切词权重调低预定数值或调低至预定切分权重;
2)均被执行添加操作的多个重点索引词的相似度特征信息为该等重点索引词的组成结构类型为某种相同或相似的组成结构类型,则调整装置7将该种相同或相似的组成结构类型的类型权重调高预定数值或调高至预定类型权重;
或者,均被执行删除操作的多个重点索引词的相似度特征信息为该等重点索引词的组成结构类型为某种相同或相似的组成结构类型,则调整装置7将该种相同或相似的组成结构类型的类型权重调低预定数值或调低至预定类型权重;
3)均被执行添加操作的多个重点索引词的相似度特征信息为均具有相似性的用户历史相关数据所属的至少一个数据分类,则调整装置7将该至少一个数据分类的分类权重调高预定数值或调高至预定分类权重;
或者,均被执行删除操作的多个重点索引词的相似度特征信息为均具有相似性的用户历史相关数据所属的至少一个数据分类,则调整装置7将该至少一个数据分类的分类权重调低预定数值或调低至预定分类权重。
在一示例中,第二确定装置6确定被执行删除操作的两个索引词K6和K7均包含相同切词片段f1“鼻炎”和f2“治疗”,且K6和K7指向的多个用户的广告信息中被该两个重点索引词指向的广告信息产生的消费数额均小于预定消费阈值,则确定K6和K7之间的相似特征信息为两个切词片段f1“鼻炎”和f2“治疗”,及数据分类中的消费数额,则调整装置7根据该等相似特征信息,将f1和f2的切词权重调低至预定切词权重,且将消费数额的分类权重减少预定数值。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词,接着根据多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,随后根据所述相似度特征信息,调整所述相同或者相似的切词片段的切词权重,所述相同或相似的组成结构类型的类型权重,和/或,所述具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重的实现方式,均应包含在本发明的范围内。
根据用户对重点索引词的更新操作来调整影响展现重要度信息及用户重要度信息的多种权重值,对该多种权重值进行调整,使得在后续获取展现重要度信息及用户重要度信息进而确定重点索引词的过程中,能够得到更加符合用户需求的重点索引词。
图3示出根据本发明另一个优选实施例的用于确定重点索引词的确定装置的结构示意图。该确定装置还包括判断装置8和第一生成装置9。
判断装置8根据重点索引词确定装置4确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断该广告信息在其被展现时所处的展现位置信息是否位于预定高优先级展现位置处。
例如,若不处于最高优先级的展现位置,则确定该广告信息为待优化广告信息。
当判断该广告信息为待优化广告信息时,第一生成装置9将该待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议。例如,第一生成装置9通过所述比对分析,确定该待优化广告信息的至少一个待优化问题,并根据该至少一个待优化问题,直接生成提升该广告信息的展现位置信息的优化建议。
其中,所述广告信息的状态信息包括但不限于任何能够反应所述广告信息当前所处状态的信息。优选地,所述广告信息的状态信息包括但不限于以下至少一项:
1)广告信息被展现时所处的展现位置信息;
2)广告信息的质量度信息,其可反映广告信息被大量网民进行搜索后的被接受的程度;其中,该广告信息的质量度信息可由确定装置或其他装置基于诸如普通网络用户对该广告的点击率、广告信息与索引词的匹配度、广告信息中的文案的可读性等因素来确定;
3)广告信息对应的重点索引词;
4)广告信息对应的重点索引词的出价信息。
优选地,第一生成装置9将待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定该待优化广告信息的至少一个待优化问题的方式包括但不限于以下至少一项:
1)将待优化广告信息被展现时所处的展现位置信息与预定高优先级展现位置信息进行比对,以确定待优化问题是否为展现位置不处于高优先级展现位置;
2)将待优化广告信息的当前质量度信息与优选状态信息中的优选质量度信息进行比对,以确定待优化问题是否为广告信息的质量度信息较低;
3)将待优化广告信息对应的重点索引词与优选状态信息中对应的重点索引词进行比对,以确定待优化问题是否为重点索引词无效;
4)将待优化广告信息对应的重点索引词的出价信息与优选状态信息中对应的重点索引词的出价信息进行比对,以确定待优化问题是否为出价过低。
在一示例中,确定装置根据所确定的重点索引词K3,在本地或第三方设备的历史数据信息库中进行查询,以获取其所指向的广告信息A1在预定时间段内每次被展现时所处的单次展现位置信息,并将多个单次展现位置信息进行求平均值计算,确定A1的展现位置信息为在页面右侧首位展示,则判断装置8将该展现位置信息与预定的展现位置优先级信息进行比较,例如,预定的展现位置优先级信息为左侧首位展现>左侧首页展现>右侧首位展现>右侧首页展现,则判断A1不处于最高优先级展现位置处,则判断装置8确定A1为待优化广告信息;接着,第一生成装置9将A1的当前状态信息中的当前质量度信息与左侧首位展现位置信息的优选状态信息中的优选质量度信息进行比对,确定A1的当前质量度信息与优选质量度信息相等,则第一生成装置9确定A1的待优化问题为q1:展现位置不处于左侧首页,q2:展现位置不处于左侧首位,接着直接生成优化建议S1:提升K3出价至优选状态信息中处于左侧首页位置的重点索引词的出价,及优化建议S2:提升K3出价至优选状态信息中处于左侧首位位置的重点索引词的出价。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断处于所述展现位置信息的广告信息是否为待优化广告信息,当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议的实现方式,均应包含在本发明的范围内。
根据重点索引词所指向的广告信息的当前状态信息,生成能够提升该广告信息在被展现时所处的展现位置信息的优化建议,进而满足用户的广告投放需求,提高广告信息的普通网络用户接受度。
优选地,第一生成装置9包括第三确定装置(图未示)和第二生成装置(图未示)。
具体地,当判断广告信息为待优化广告信息时,第三确定装置将该待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定该待优化广告信息的多个待优化问题及其分别所属的多个问题属性,如对已确定的多个待优化问题进行属性分析,以确定其分别所属的多个问题属性;其中,所述问题属性包括但不限于:质量度相关、价格相关、关键词状态相关;当存在属于相同问题属性的多个待优化问题时,第二生成装置基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,来生成优化建议。其中,第三确定装置确定待优化广告信息的多个待优化问题的方式已在参照图3所示实施例中予以详述,在此不再赘述。
在一示例中,接上例,重点索引词K3指向的待优化广告信息为A1,第三确定装置确定A1的待优化问题为q1:展现位置不处于左侧首页,q2:展现位置不处于左侧首位,接着,第三确定装置对q1及q2进行属性分析,确定其均属于价格相关属性,则第二生成装置基于预确定的待优化问题优先级信息:不处于左侧首位展现>不处于左侧首页展现>质量度信息较低>重点索引词无效,选择q2来生成优化建议S2:提升K3出价至优选状态信息中处于左侧首位位置的重点索引词的出价。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定所述待优化广告信息的多个待优化问题及其分别所属的多个问题属性,当存在属于相同问题属性的多个待优化问题时,基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,生成所述优化建议的实现方式,均应包含在本发明的范围内。
选择优先级较高待优化问题来生成优化建议,可减少生成有重叠内容的优化建议,从而简化生成优化建议的复杂度,提升生成效率;同时,可减少后续将优化建议提供至用户的次数,降低对用户的打搅次数,提升用户使用体验。
作为本实施例的优选方案之一(如图3所示),该确定装置还包括提供装置(未示出),提供装置将所述优化建议以与其相适应的方式提供至所述用户。
在此,优化建议的提供方式包括但不限于:
1)通过短信方式发送;
2)通过邮件方式发送;
3)通过系统内短消息的方式发送。
其中,与优化建议相适应的方式包括但不限于:
1)若优化建议对应的发送频率较高,则使用站短方式;
2)若优化建议对应的发送频率较低,则使用短信或邮件发送。
在一示例中,优化建议为S1:提升重点索引词出价至优选状态信息中处于左侧首页位置的重点索引词的出价,及S2:提升重点索引词出价至优选状态信息中处于左侧首位位置的重点索引词的出价,当提供装置需要联系将与调整出价相关的优化建议S1与S2连续提供至用户时,则提供装置选择站短方式发送S1与S2。
优选地,用户可预设置其所希望的针对不同优化建议的不同提供方式;例如,用户预设与质量度相关的优化建议通过邮件方式发送,与价格相关的优化建议通过系统内短消息的方式发送,与关键词状态相关的优化建议通过移动通信网短信的方式发送。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所述优化建议以与其相适应的方式提供至所述用户的实现方式,均应包含在本发明的范围内。
图4示出本发明一个方面的用于确定重点索引词的方法流程图。根据本优选实施例的方法包括步骤S1、步骤S2、步骤S3、步骤S4、步骤S5和步骤S6。其中,本发明的方法主要通过计算机设备来实现。
其中,所述计算机设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件可包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。所述计算机设备包括但不限于个人计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。
本领域技术人员应能理解上述计算机设备仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
本发明中,一个用户可选择多个索引词,其中,用户选择的每个索引词均指向该用户的一个广告。此外,多个用户可选择相同的索引词,也即,一个索引词可指向多个用户的多个广告。
本发明的计算机设备确定用户选择的多个索引词中的一个索引词的展现重要度信息。
具体地,计算机设备获取一个索引词的展现重要度信息的方式包括但不限于:
在步骤S1中,计算机设备获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;在步骤S2中,计算机设备根据所述排序位置信息,获得该索引词的展现重要度信息。
更具体地,对于每个数据分类,在步骤S1中,计算机设备对属于该数据分类的用户历史相关数据进行排序,并获得需要处理的一个索引词的各个用户历史相关数据分别在其所属数据分类下的排序位置信息;接着,在步骤S1中,计算机设备将该一个索引词在各个数据分类中的排序位置信息进行诸如求和、求取平方和等计算,以获得该一个索引词的展现重要度。
其中,所述属于多个数据分类的用户历史相关数据包括但不限于以下至少一项:
1)该用户的广告信息中被该索引词指向的广告信息的广告点击量;其中,该广告点击量可包括在预定历史时间段内被该索引词指向的广告信息的广告点击量。
2)该用户的广告信息中被该索引词指向的广告信息产生的消费数额;其中,该消费数额可包括在预定历史时间段内被该索引词指向的广告信息产生的消费数额。
3)该用户的广告信息中被该索引词指向的广告信息的重点位置展现次数;其中,所述重点位置意指网民关注度较高的搜索结果页面位置,例如,通过自然搜索获取的自然搜索结果展示于页面左侧位置,则网民关注度较高的搜索结果页面位置在页面左侧位置,该页面左侧位置为重点位置;所述重点位置展现次数可包括在预定历史时间段内被该索引词指向的广告信息的重点位置展现次数。
4)该用户的广告信息中被该索引词指向的广告信息的重点位置展现率;其中,该重点位置展现率包括在预定历史时间段内被索引词指向的广告信息的重点位置展现次数与该广告信息的全部展现次数的比值。
5)该用户的广告信息中被该索引词指向的广告信息在该索引词指向的所有广告中的展现排位;其中,所述展现排位可包括在预定历史时间段内被该索引词指向的广告信息在该索引词指向的所有广告中的平均展现排位。
6)选择该索引词的所有用户对该索引词的操作次数;其中,所述操作包括但不限于:对索引词的出价信息的调整操作、对索引词投放时段信息的调整操作等;所述操作次数可为在预定历史时间段内选择该索引词的所有用户对该索引词的操作次数。
7)选择该索引词的其他用户的用户数量。
在一示例中,用户选择的四个索引词分别为Q1、Q2、Q3和Q4,且多个数据分类包括用户历史相关数据中被该用户选择的一个索引词指向的广告信息的广告点击量T、该广告信息产生的消费数额C及该广告信息的重点位置展现次数S;当计算机设备需要获取索引词Q1的展现重要度信息时,首先,在步骤S 1中,计算机设备从本地的历史数据信息库中或从第三方设备中获取得到该四个索引词关键词属于该三个数据分类的用户历史相关数据;接着,对于每个数据分类,计算机设备对该四个索引词关键词属于该数据分类的用户历史相关数据按照从小到大的顺序进行排序,并获得Q1的各个用户历史相关数据分别在其所属数据分类下的排序位置信息;如下表1所示:
表1:
Figure BDA00001845474600231
接着,在步骤S2中,计算机设备将Q1在该三个数据分类中的排序位置信息3、4、2,进行求和计算,以获得Q1的展现重要度=3+4+2=9,即计算机设备获取Q1的展现重要度为9。
在另一示例中,在步骤S 1中,计算机设备已预先完成排序操作并获得如表1所示的排序位置信息,则当需要获取索引词Q1的展现重要度信息时,在步骤S2中,计算机设备直接根据表1中所示的排序位置信息,获得Q1的展现重要度。
在此,需要说明的是,上述举例中的各项数值仅为说明作用的示例,以供读者理解本发明,并非实际应用时的真实数据,不应视为对本专利申请保护范围的任何限制。如无特别说明,本文中其他地方出现的数值的功用与此处相同,为简明起见,不再赘述。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取一个索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息,并根据所述排序位置信息,获得该索引词的展现重要度信息的实现方式,均应包含在本发明的范围内。
通过根据用户选择的一个索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息来确定该索引词的展现重要度信息,实现了从广告展现角度的多个数据分类的多维度出发,对该索引词的用户历史相关数据基于不同维度进行排序分析,使得获取的该索引词的展现重要度信息能够完整且准确地反映该索引词与其他用户选择的索引词相比其指向广告的展现效果,为进一步从多个索引词中准确地确定重点索引词提供有力保证。
优选地,步骤S2包括步骤S201(图未示),在步骤S201中,计算机设备基于所述各个数据分类的分类权重,对其在步骤S1中获取的该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息。
在一示例中,接上例,在步骤S1中,计算机设备已获取的索引词Q1在三个数据分类T、C和S中的排序位置信息分别为3、4、2,且预定的的该三个数据分类T、C和S分别对应的分类权重为1.5、2和1,则在步骤S201中,计算机设备根据该三个分类权重对其分别对应的排序位置信息进行加权计算,获得Q1的展现重要度信息=3×1.5+4×2+2×1=14.5。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何基于所述各个数据分类的分类权重,对该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息的实现方式,均应包含在本发明的范围内。
考虑到不同数据分类中的用户历史相关数据在确定索引词的展现重要度时具有不同程度的影响,因此引入分类权重对索引词分别在各个数据分类中的排序位置信息进行加权,能够获得更为准确的展现重要度信息。
本发明的计算机设备确定一个索引词的用户重要度信息。
具体地,计算机设备获取用户重要度信息的方式包括但不限于:
在步骤S3中,计算机设备获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;在步骤S4中,计算机设备根据所述出现频度信息,确定该索引词的用户重要度信息。
其中,所述其他用户可包括除该用户之外的全部其他用户,也可包括与该用户属于同一用户分类的其他用户。
更具体地,首先,在步骤S3中,计算机设备通过切词算法对该索引词进行切词处理,以获得该索引词的至少一个切词片段,并获取该至少一个切词片段在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;其中,前述切词算法包括但不限于正向最大匹配,反向最大匹配,双向最大匹配,语言模型方法,最短路径算法等。
优选地,在步骤S3中,计算机设备获取出现频度信息的方式包括但不限于:
1)在步骤S3中,计算机设备获取该至少一个切词片段在该用户选择的索引词中的出现频度信息,作为该至少一个切词片段的出现频度信息;
2)在步骤S3中,计算机设备获取将该至少一个切词片段在该用户与其他用户选择的索引词中的出现频度信息,作为该至少一个切词片段的出现频度信息;
3)在步骤S3中,计算机设备获取该至少一个切词片段在该用户选择的索引词中的出现频度信息,及将该至少一个切词片段在该用户与其他用户选择的索引词中的出现频度信息,并对上述两个出现频度信息进行平均值计算,将平均值计算结果作为该至少一个切词片段的出现频度信息。
随后,在步骤S4中,计算机设备根据所获取的该至少一个切词片段的出现频度信息,将该至少一个切词片段的出现频度信息进行诸如求和、求取平方和等计算,并将计算结果以作为该索引词的用户重要度信息。
在一示例中,用户选择的三个索引词分别为Q5“鼻炎怎么治疗”、Q6“鼻炎治疗方法”和Q7“鼻炎治疗”,当计算机设备需要获取索引词Q6的用户重要度信息时,首先,在步骤S3中,计算机设备通过切词算法对Q6进行切词处理,以获得三个切词片段f1“鼻炎”、f2“治疗”和f3“方法”;接着,计算机设备通过例如字符串匹配等的匹配方式,将该三个切词片段分别在该用户选择的索引词Q5、Q6及Q7中进行匹配查询,以获取f1、f2及f3的出现频度信息分别为0.375、0.375、0.125;随后,在步骤S4中,计算机设备对已获取的f1、f2及f3的出现频度信息进行求和计算,以确定Q5的用户重要度信息=0.375+0.375+0.125=0.875。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息,接着根据所述出现频度信息确定该索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
通过分析对一个索引词进行切词处理后得到的切词片段在两类索引词集合的范围内的出现频度,从而确定该索引词的用户重要度信息,能够使获得的该用户重要度信息全面地反映该用户,所有其他用户,及/或其与该用户属于同一用户分类的其他用户对该索引词的重视程度,也在一定程度反映了该索引词符合用户投放需求的程度,为进一步从多个索引词中准确地确定重点索引词提供有力保证。
优选地,步骤S4中包括步骤S401(图未示),在步骤S401中,计算机设备将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息。
其中,所述组成结构类型意指索引词的句子或短语的结构类型,如疑问句类型、陈述句类型、主谓短语类型、动宾短语类型等。
在一示例中,接上例,在步骤S3中,计算机设备获取索引词Q5“鼻炎怎么治疗”的三个切词片段f1、f2及f3的出现频度信息分别为0.375、0.375、0.125,且预确定的组成结构类型的类型权重分别为疑问句类型权重为4、陈述句类型1、主谓短语类型1.5、动宾短语类型2;在步骤S401中,计算机设备对Q5通过例如自然语言分析的方式对Q5进行分型分析,确定其为疑问句类型,则将该疑问句类型权重4加权给Q5的切词片段f1、f2及f3的出现频度信息,以确定Q5的用户重要度信息=4×(0.3754+0.375+0.125)=3.5;优选地,所述自然语言分析可通过OpenNLP、FudanNLP、Standford NLP、语言技术平台(LTP)等自然语言处理工具来实现。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
由于对于不同的组成结构类型,投放广告的用户和普通网络网民会产生不同的关注度,例如,更多的投放广告的用户习惯选择疑问句类型的索引词,且更多的普通网络用户在搜索时习惯输入疑问句类型的查询序列,因此将组成结构类型的类型权重加权给切词片段的出现频度信息,能够获取更为准确的用户重要度信息。
更优选地,步骤S4中包括步骤S402(图未示),在步骤S402中,计算机设备将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段的预确定的切词权重,确定所述索引词的用户重要度信息。
在一示例中,接上例,在步骤S3中,计算机设备获取索引词Q5“鼻炎怎么治疗”的三个切词片段f1、f2及f3的出现频度信息分别为0.375、0.375、0.125,预确定的组成结构类型的类型权重分别为疑问句类型权重为4、陈述句类型1、主谓短语类型1.5、动宾短语类型2,且预确定的f1的切词权重为1.5、f2的切词权重为1及f3的切词权重为0.8;首先,在步骤S402中,计算机设备对Q5通过自然语言分析以确定其为疑问句,则将该疑问句类型权重4加权给Q5的切词片段f1、f2及f3的出现频度信息,并结合该三个切词片段的预确定的切词权重,以确定Q5的用户重要度信息为=4×(0.3754×1.5+0.375×1+0.125×0.8)=4.15。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段与预确定的切词权重,确定所述索引词的用户重要度信息的实现方式,均应包含在本发明的范围内。
由于索引词切分后获得切词片度在该索引词中的重要度不同,因此引入切词片度的切词权重来对用户重要度信息进行调优,能够进一步调整获取的用户重要度信息的准确度。
本实施例的上述内容已说明如何获得展现重要度信息以及用户重要度信息,以下将叙述如何基于展现重要度信息以及用户重要度信息,选择重点索引词。
本发明的计算机设备在步骤S5中获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息、
具体地,作为一种优选方案(图未示),步骤S5包括步骤S1、步骤S2、步骤S3和步骤S4,并且,通过计算机设备在包含于步骤S5中的步骤S 1和步骤S2中的操作,计算机设备在步骤S5中获取用户选择的多个索引词各自的展现重要度信息,并通过计算机设备在包含于步骤S5中的步骤S3和步骤S4中的操作,计算机设备在步骤S5获取用户选择的多个索引词各自的用户重要度信息。
作为另一优选方案,如图4所示,步骤S1、步骤S2、步骤S3和步骤S4与步骤S5相独立,并在步骤S5之前执行操作;则在步骤S5中,计算机设备直接获得其通过执行步骤S1、步骤S2、步骤S3和步骤S4预确定的展现重要度信息及用户重要度信息,例如,在步骤S5中,计算机设备可获取已预存在网络数据库中的用户选择的多个索引词各自的展现重要度信息及用户重要度信息。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息的实现方式,均应包含在本发明的范围内。
在步骤S6中,计算机设备根据所获取的多个索引词的展现重要度信息及用户重要度信息,从所述多个索引词中确定至少一个重点索引词。
具体地,在步骤S6中,计算机设备确定至少一个重点索引词的方式包括但不限于:
1)将计算机设备在步骤S5中获取的多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词。
例如,在步骤S6中,计算机设备将多个索引词中展现重要度信息大于预定的展现重要度阈值,且用户重要度信息大于的预定的用户重要度阈值的至少一个索引词,作为重点索引词。
又例如,在步骤S6中,计算机设备将多个索引词中展现重要度信息大于预定的展现重要度阈值,或用户重要度信息大于的预定的用户重要度阈值的至少一个索引词,作为重点索引词。
3)在步骤S6中,计算机设备根据展现重要度信息及用户重要度信息,确定一个用于评价索引词重要度的重要度评价值,并将重要度评价值超过预定重要度阈值的索引词,作为重点索引词。
例如,在步骤S6中,计算机设备先将各个索引词的展现重要度信息及用户重要度信息进行归一化处理,再对归一化处理后的值求取平均值,并将平均值超过预定重要度阈值的索引词,作为重点索引词。
其中,需要说明的事,展现重要度信息大于预定的展现重要度阈值的确定重点索引词的标准是针对用户历史数据信息按照从小到大的顺序进行排序;当用户历史数据信息按照从大到小的顺序进行排序时,确定重点索引词的标准为展现重要度信息小于预定的展现重要度阈值。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,以从所述多个索引词中确定至少一个重点索引词的实现方式,均应包含在本发明的范围内。
将用户选择的多个索引词的展现重要度信息及用户重要度信息相结合,来从该多个索引词中确定至少一个重点索引词,实现了从多个索引词的展现效果角度和用户需求角度出发精确地确定其中的重点索引词,实现了确定重点索引词的客观性和准确性,使得所确定的重点索引词能够保证既包括在广告投放过程中的展现效果较好的索引词,又包括用户重视度较高的索引词。
图5示出根据本发明一个优选实施例的用于确定重点索引词的方法流程图。该方法还包括步骤S7、步骤S8和步骤S9。
本实施例中,计算机设备通过与多个用户的交互操作,将已确定的重点索引词提供至该多个用户,并获取该多个用户对提供至其的重点索引词的更新操作。
接着,在步骤S7中,计算机设备根据该多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词。优选地,所述更新操作的操作类型包括但不限于添加操作、删除操作等。
在一示例中,计算机设备通过与多个用户的交互操作,将已确定的重点索引词K1、K2、K3、K4、K5提供至该多个用户,并获取该多个用户均对K1和K3执行的删除操作,则在步骤S7中,计算机设备确定被执行删除操作相同的重点索引词为K1和K3。
随后,在步骤S8中,计算机设备根据其在步骤S7中确定的多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,其中,该相似特征信息包括所述多个重点索引词之间包含的相同或相似的切词片段,多个重点索引词之间相同或相似的组成结构类型,和/或,所述多个重点索引词之间具有相似性的用户历史相关数据所属的至少一个数据分类。
例如,当确定被执行删除操作相同的两个索引词分别为K6“鼻炎怎么治疗”和K7“鼻炎治疗方法”时,且已切分得到该两个重点索引词之间包含的相同切词片段为f1“鼻炎”和f2“治疗”,则在步骤S8中,计算机设备确定该两个切词片段f1和f2为该两个重点索引词之间的相似特征信息。
又例如,当确定被执行添加操作相同的两个索引词分别为K6“鲜花预定”和K7“鲜花快递”,在步骤S8中,计算机设备对该两个索引词进行自然语言分析,确定K6和K7的组成结构类型均为主谓短语,则计算机设备确定主谓短语为该两个重点索引词之间的相似特征信息。
再例如,当确定被执行删除操作相同的重点索引词为K1和K3时,在步骤S8中,计算机设备对该两个重点索引词的用户历史相关数据进行相似特征分析,确定K1和K3指向的多个用户的广告信息中被该两个重点索引词指向的广告信息的广告点击量均小于预定点击阈值,则将K1和K3的指向的广告信息的广告点击量作为其之间的相似度特征信息。
随后,在步骤S9中,计算机设备根据其在步骤S8中确定的相似度特征信息,调整该(等)相同或者相似的切词片段的切词权重,该(等)相同或相似的组成结构类型的类型权重,和/或,该(等)具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重。
优选地,在步骤S9中,计算机设备调整切词片段的切词权重,组成结构类型的类型权重,和/或,数据分类的分类权重的方式包括但不限于:
1)均被执行添加操作的多个重点索引词的相似度特征信息为均包括一个或多个相同或者相似的片段信息,则在步骤S9中,计算机设备将该(等)相同或者相似的切词片段的切词权重调高预定数值或调高至预定切分权重;或者,均被执行删除操作的多个重点索引词的相似度特征信息为均包括一个或多个相同或者相似的片段信息,则在步骤S9中,计算机设备将该(等)相同或者相似的切词片段的切词权重调低预定数值或调低至预定切分权重;
2)均被执行添加操作的多个重点索引词的相似度特征信息为该等重点索引词的组成结构类型为某种相同或相似的组成结构类型,则在步骤S9中,计算机设备将该种相同或相似的组成结构类型的类型权重调高预定数值或调高至预定类型权重;
或者,均被执行删除操作的多个重点索引词的相似度特征信息为该等重点索引词的组成结构类型为某种相同或相似的组成结构类型,则在步骤S9中,计算机设备将该种相同或相似的组成结构类型的类型权重调低预定数值或调低至预定类型权重;
3)均被执行添加操作的多个重点索引词的相似度特征信息为均具有相似性的用户历史相关数据所属的至少一个数据分类,则在步骤S9中,计算机设备将该至少一个数据分类的分类权重调高预定数值或调高至预定分类权重;
或者,均被执行删除操作的多个重点索引词的相似度特征信息为均具有相似性的用户历史相关数据所属的至少一个数据分类,则在步骤S9中,计算机设备将该至少一个数据分类的分类权重调低预定数值或调低至预定分类权重。
在一示例中,在步骤S8中,计算机设备确定被执行删除操作的两个索引词K6和K7均包含相同切词片段f1“鼻炎”和f2“治疗”,且K6和K7指向的多个用户的广告信息中被该两个重点索引词指向的广告信息产生的消费数额均小于预定消费阈值,则确定K6和K7之间的相似特征信息为两个切词片段f1“鼻炎”和f2“治疗”,及数据分类中的消费数额,则在步骤S9中,计算机设备根据该等相似特征信息,将f1和f2的切词权重调低至预定切词权重,且将消费数额的分类权重减少预定数值。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词,接着根据多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,随后根据所述相似度特征信息,调整所述相同或者相似的切词片段的切词权重,所述相同或相似的组成结构类型的类型权重,和/或,所述具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重的实现方式,均应包含在本发明的范围内。
根据用户对重点索引词的更新操作来调整影响展现重要度信息及用户重要度信息的多种权重值,对该多种权重值进行调整,使得在后续获取展现重要度信息及用户重要度信息进而确定重点索引词的过程中,能够得到更加符合用户需求的重点索引词。
图6示出根据本发明另一个优选实施例的用于确定重点索引词的方法流程图。该方法还包括步骤S10和步骤S11。
在步骤S10中,计算机设备根据其在步骤S6中确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断该广告信息在其被展现时所处的展现位置信息是否位于预定高优先级展现位置处。
例如,若不处于最高优先级的展现位置,则确定该广告信息为待优化广告信息。
当判断该广告信息为待优化广告信息时,在步骤S11中,计算机设备将该待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议。例如,在步骤S11中,计算机设备通过所述比对分析,确定该待优化广告信息的至少一个待优化问题,并根据该至少一个待优化问题,直接生成提升该广告信息的展现位置信息的优化建议。
其中,所述广告信息的状态信息包括但不限于任何能够反应所述广告信息当前所处状态的信息。优选地,所述广告信息的状态信息包括但不限于以下至少一项:
1)广告信息被展现时所处的展现位置信息;
2)广告信息的质量度信息,其可反映广告信息被大量网民进行搜索后的被接受的程度;其中,该广告信息的质量度信息可由计算机设备或其他设备基于诸如普通网络用户对该广告的点击率、广告信息与索引词的匹配度、广告信息中的文案的可读性等因素来确定;
3)广告信息对应的重点索引词;
4)广告信息对应的重点索引词的出价信息。
优选地,在步骤S11中,计算机设备将待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定该待优化广告信息的至少一个待优化问题的方式包括但不限于以下至少一项:
1)将待优化广告信息被展现时所处的展现位置信息与预定高优先级展现位置信息进行比对,以确定待优化问题是否为展现位置不处于高优先级展现位置;
2)将待优化广告信息的当前质量度信息与优选状态信息中的优选质量度信息进行比对,以确定待优化问题是否为广告信息的质量度信息较低;
3)将待优化广告信息对应的重点索引词与优选状态信息中对应的重点索引词进行比对,以确定待优化问题是否为重点索引词无效;
4)将待优化广告信息对应的重点索引词的出价信息与优选状态信息中对应的重点索引词的出价信息进行比对,以确定待优化问题是否为出价过低。
在一示例中,计算机设备根据所确定的重点索引词K3,在本地或第三方设备的历史数据信息库中进行查询,以获取其所指向的广告信息A1在预定时间段内每次被展现时所处的单次展现位置信息,并将多个单次展现位置信息进行求平均值计算,确定A1的展现位置信息为在页面右侧首位展示,则在步骤S10中,计算机设备将该展现位置信息与预定的展现位置优先级信息进行比较,例如,预定的展现位置优先级信息为左侧首位展现>左侧首页展现>右侧首位展现>右侧首页展现,则判断A1不处于最高优先级展现位置处,则计算机设备确定A1为待优化广告信息;接着,在步骤S11中,计算机设备将A1的当前状态信息中的当前质量度信息与左侧首位展现位置信息的优选状态信息中的优选质量度信息进行比对,确定A1的当前质量度信息与优选质量度信息相等,则计算机设备确定A1的待优化问题为q1:展现位置不处于左侧首页,q2:展现位置不处于左侧首位,接着直接生成优化建议S1:提升K3出价至优选状态信息中处于左侧首页位置的重点索引词的出价,及优化建议S2:提升K3出价至优选状态信息中处于左侧首位位置的重点索引词的出价。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断处于所述展现位置信息的广告信息是否为待优化广告信息,当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议的实现方式,均应包含在本发明的范围内。
根据重点索引词所指向的广告信息的当前状态信息,生成能够提升该广告信息在被展现时所处的展现位置信息的优化建议,进而满足用户的广告投放需求,提高广告信息的普通网络用户接受度。
优选地,步骤S11还包括步骤S111(图未示)和步骤S112(图未示)。
具体地,当判断广告信息为待优化广告信息时,在步骤S111中,计算机设备将该待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定该待优化广告信息的多个待优化问题及其分别所属的多个问题属性,如对已确定的多个待优化问题进行属性分析,以确定其分别所属的多个问题属性;其中,所述问题属性包括但不限于:质量度相关、价格相关、关键词状态相关;当存在属于相同问题属性的多个待优化问题时,在步骤S112中,计算机设备基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,来生成优化建议。其中,在步骤S111中计算机设备确定待优化广告信息的多个待优化问题的方式已在参照图6所示实施例中予以详述,在此不再赘述。
在一示例中,接上例,重点索引词K3指向的待优化广告信息为A1,计算机设备A1的待优化问题为q1:展现位置不处于左侧首页,q2:展现位置不处于左侧首位,接着,在步骤S111中,计算机设备对q1及q2进行属性分析,确定其均属于价格相关属性,则在步骤S112中,计算机设备基于预确定的待优化问题优先级信息:不处于左侧首位展现>不处于左侧首页展现>质量度信息较低>重点索引词无效,选择q2来生成优化建议S2:提升K3出价至优选状态信息中处于左侧首位位置的重点索引词的出价。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定所述待优化广告信息的多个待优化问题及其分别所属的多个问题属性,当存在属于相同问题属性的多个待优化问题时,基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,生成所述优化建议的实现方式,均应包含在本发明的范围内。
选择优先级较高待优化问题来生成优化建议,可减少生成有重叠内容的优化建议,从而简化生成优化建议的复杂度,提升生成效率;同时,可减少后续将优化建议提供至用户的次数,降低对用户的打搅次数,提升用户使用体验。
作为本实施例的优选方案之一(如图6所示),该方法还包括步骤S12(未示出),在步骤S12中,计算机设备将所述优化建议以与其相适应的方式提供至所述用户。
在此,优化建议的提供方式包括但不限于:
1)通过短信方式发送;
2)通过邮件方式发送;
3)通过系统内短消息的方式发送。
其中,与优化建议相适应的方式包括但不限于:
1)若优化建议对应的发送频率较高,则使用站短方式;
2)若优化建议对应的发送频率较低,则使用短信或邮件发送。
在一示例中,优化建议为S1:提升重点索引词出价至优选状态信息中处于左侧首页位置的重点索引词的出价,及S2:提升重点索引词出价至优选状态信息中处于左侧首位位置的重点索引词的出价,当在步骤S 12中,计算机设备需要联系将与调整出价相关的优化建议S1与S2连续提供至用户时,则计算机设备选择站短方式发送S1与S2。
优选地,用户可预设置其所希望的针对不同优化建议的不同提供方式;例如,用户预设与质量度相关的优化建议通过邮件方式发送,与价格相关的优化建议通过系统内短消息的方式发送,与关键词状态相关的优化建议通过移动通信网短信的方式发送。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所述优化建议以与其相适应的方式提供至所述用户的实现方式,均应包含在本发明的范围内。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,其中的硬件可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他步骤,单数不排除复数。装置权利要求中陈述的多个装置也可以由一个装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (19)

1.一种用于确定重点索引词的方法,该方法包括以下步骤:
a 获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;
b 根据所述多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,从所述多个索引词中确定至少一个重点索引词;
其中,一个索引词的展现重要度信息通过以下步骤来确定:
i1 获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;
i2 根据所述排序位置信息,获得该索引词的展现重要度信息;
其中,一个索引词的用户重要度信息通过以下步骤来确定:
x1获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;
x2 根据所述出现频度信息,确定该索引词的用户重要度信息。
2.根据权利要求1所述的方法,其中,所述步骤i2包括:
-基于所述各个数据分类的分类权重,对该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息。
3.根据权利要求1或2所述的方法,其中,所述步骤x2包括:
x2’将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息。
4.根据权利要求3所述的方法,其中,所述步骤x2’包括:
-将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段的预确定的切词权重,确定所述索引词的用户重要度信息。
5.根据权利要求2至4中任一项所述的方法,其中,该方法还包括:
-根据多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词;
-根据多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,其中,该相似特征信息包括所述多个重点索引词之间包含的相同或相似的切词片段,多个重点索引词之间相同或相似的组成结构类型,和/或,所述多个重点索引词之间具有相似性的用户历史相关数据所属的至少一个数据分类;
-根据所述相似度特征信息,调整所述相同或者相似的切词片段的切词权重,所述相同或相似的组成结构类型的类型权重,和/或,所述具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重。
6.根据权利要求2至4中任一项所述的方法,其中,所述用户选择的一个索引词用于指向所述用户的一条广告信息,该方法还包括:
m 根据所确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断处于所述展现位置信息的广告信息是否为待优化广告信息;
n 当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议。
7.根据权利要求6所述的方法,其中,所述步骤n包括:
-当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定所述待优化广告信息的多个待优化问题及其分别所属的多个问题属性;
-当存在属于相同问题属性的多个待优化问题时,基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,生成所述优化建议。
8.根据权利要求6或7所述的方法,其中,该方法还包括:
-将所述优化建议以与其相适应的方式提供至所述用户。
9.根据权利要求1至8中任一项所述的方法,其中,所述属于多个数据分类的用户历史相关数据包括以下至少一项:
-所述用户的广告信息中被所述索引词指向的广告信息的广告点击量;
-所述用户的广告信息中被所述索引词指向的广告信息产生的消费数额;
-所述用户的广告信息中被所述索引词指向的广告信息的重点位置展现次数;
-所述用户的广告信息中被所述索引词指向的广告信息的重点位置展现率;
-所述用户的广告信息中被所述索引词指向的广告信息在该索引词指向的所有广告中的展现排位;
-选择所述索引词的所有用户对所述索引词的操作次数;
-选择所述索引词的其他用户的用户数量。
10.一种用于确定重点索引词的确定装置,该确定装置包括:
重要度获取装置,用于获取用户选择的多个索引词各自的展现重要度信息及用户重要度信息;
重点索引词确定装置,用于根据所述多个索引词的展现重要度信息及用户重要度信息,分别与该两种重要度信息各自对应的预定重要度阈值进行比较,从所述多个索引词中确定至少一个重点索引词;
其中,该确定装置还包括第一重要度确定装置,用于确定一个索引词的展现重要度信息,
其中,所述第一重要度确定装置包括:
排序位置获取装置,用于获取该索引词属于多个数据分类的用户历史相关数据分别在各个数据分类中的排序位置信息;
展现重要度获取装置,用于根据所述排序位置信息,获得该索引词的展现重要度信息;
其中,该确定装置还包括第二重要度确定装置,用于确定一个索引词的用户重要度信息;
其中,所述第二重要度确定装置包括:
频度获取装置,用于获取该索引词进行切词处理后获得的至少一个切词片段的在该用户和/或该用户与其他用户选择的索引词中的出现频度信息;
用户重要度确定装置,用于根据所述出现频度信息,确定该索引词的用户重要度信息。
11.根据权利要求10所述的确定装置,其中,所述展现重要度获取装置包括:
第一子获取装置,用于基于所述各个数据分类的分类权重,对该索引词分别在各个数据分类中的排序位置信息进行加权计算,获得该索引词的展现重要度信息。
12.根据权利要求10或11所述的确定装置,其中,所述用户重要度确定装置包括:
第二子获取装置,用于将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,来确定所述索引词的用户重要度信息。
13.根据权利要求12所述的确定装置,其中,所述第二子获取装置装置包括:
第三子获取装置,用于将该索引词的、预确定的组成结构类型的类型权重加权给所述至少一个切词片段的出现频度信息,并结合所述至少一个切词片段的预确定的切词权重,确定所述索引词的用户重要度信息。
14.根据权利要求11至13中任一项所述的确定装置,其中,该确定装置还包括:
第一确定装置,用于根据多个用户对已确定的重点索引词的更新操作,确定被执行的更新操作的操作类型相同的多个重点索引词;
第二确定装置,用于根据多个重点索引词和/或其用户历史相关数据,确定该多个重点索引词之间的相似特征信息,其中,该相似特征信息包括所述多个重点索引词之间包含的相同或相似的切词片段,多个重点索引词之间相同或相似的组成结构类型,和/或,所述多个重点索引词之间具有相似性的用户历史相关数据所属的至少一个数据分类;
调整装置,用于根据所述相似度特征信息,调整所述相同或者相似的切词片段的切词权重,所述相同或相似的组成结构类型的类型权重,和/或,所述具有相似性的用户历史相关数据所属的至少一个数据分类的分类权重。
15.根据权利要求11至13中任一项所述的确定装置,其中,所述用户选择的一个索引词用于指向所述用户的一条广告信息,该确定装置还包括:
判断装置,用于根据所确定的一个重点索引词所指向的一条广告信息在其被展现时所处的展现位置信息,并基于预定的展现位置优先级信息,判断处于所述展现位置信息的广告信息是否为待优化广告信息;
第一生成装置,用于当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以生成提升所述广告信息的展现位置信息的优化建议。
16.根据权利要求15所述的确定装置,其中,所述第一生成装置包括:
第三确定装置,用于当判断所述广告信息为待优化广告信息时,将所述待优化广告信息的当前状态信息与预定高优先级展现位置信息的优选状态信息进行比对分析,以确定所述待优化广告信息的多个待优化问题及其分别所属的多个问题属性;
第二生成装置,用于当存在属于相同问题属性的多个待优化问题时,基于预确定的待优化问题优先级信息,选择优先级较高的至少一个待优化问题,生成所述优化建议。
17.根据权利要求15或16所述的确定装置,其中,该确定装置还包括:
提供装置,用于将所述优化建议以与其相适应的方式提供至所述用户。
18.根据权利要求10至17中任一项所述的确定装置,其中,所述属于多个数据分类的用户历史相关数据包括以下至少一项:
-所述用户的广告信息中被所述索引词指向的广告信息的广告点击量;
-所述用户的广告信息中被所述索引词指向的广告信息产生的消费数额;
-所述用户的广告信息中被所述索引词指向的广告信息的重点位置展现次数;
-所述用户的广告信息中被所述索引词指向的广告信息的重点位置展现率;
-所述用户的广告信息中被所述索引词指向的广告信息在该索引词指向的所有广告中的展现排位;
-选择所述索引词的所有用户对所述索引词的操作次数;
-选择所述索引词的其他用户的用户数量。
19.一种计算机设备,包括如权利要求9至18中至少一项所述的确定装置。
CN201210229104.0A 2012-07-03 2012-07-03 一种用于确定重点索引词的方法、装置和设备 Active CN103530789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210229104.0A CN103530789B (zh) 2012-07-03 2012-07-03 一种用于确定重点索引词的方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210229104.0A CN103530789B (zh) 2012-07-03 2012-07-03 一种用于确定重点索引词的方法、装置和设备

Publications (2)

Publication Number Publication Date
CN103530789A true CN103530789A (zh) 2014-01-22
CN103530789B CN103530789B (zh) 2018-09-07

Family

ID=49932777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210229104.0A Active CN103530789B (zh) 2012-07-03 2012-07-03 一种用于确定重点索引词的方法、装置和设备

Country Status (1)

Country Link
CN (1) CN103530789B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402960A (zh) * 2017-06-15 2017-11-28 成都优易数据有限公司 一种基于语义语气加权的倒排索引优化算法
CN107733775A (zh) * 2016-08-12 2018-02-23 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107766400A (zh) * 2017-05-05 2018-03-06 平安科技(深圳)有限公司 文本检索方法及系统
CN111241259A (zh) * 2020-01-08 2020-06-05 百度在线网络技术(北京)有限公司 交互信息推荐方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006112507A1 (ja) * 2005-04-20 2006-10-26 Intellectual Property Bank Corp. 調査対象文書の索引語抽出装置及び文書特徴分析装置
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
US20100161655A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute System for string matching based on segmentation method and method thereof
CN101944102A (zh) * 2010-08-04 2011-01-12 张占平 一种从众多网络搜索词里生成折射词的方法
CN101963972A (zh) * 2010-07-01 2011-02-02 深港产学研基地产业发展中心 情感关键词提取方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006112507A1 (ja) * 2005-04-20 2006-10-26 Intellectual Property Bank Corp. 調査対象文書の索引語抽出装置及び文書特徴分析装置
US20100161655A1 (en) * 2008-12-22 2010-06-24 Electronics And Telecommunications Research Institute System for string matching based on segmentation method and method thereof
CN101593200A (zh) * 2009-06-19 2009-12-02 淮海工学院 基于关键词频度分析的中文网页分类方法
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法
CN101963972A (zh) * 2010-07-01 2011-02-02 深港产学研基地产业发展中心 情感关键词提取方法及系统
CN101944102A (zh) * 2010-08-04 2011-01-12 张占平 一种从众多网络搜索词里生成折射词的方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107733775A (zh) * 2016-08-12 2018-02-23 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107766400A (zh) * 2017-05-05 2018-03-06 平安科技(深圳)有限公司 文本检索方法及系统
CN107402960A (zh) * 2017-06-15 2017-11-28 成都优易数据有限公司 一种基于语义语气加权的倒排索引优化算法
CN107402960B (zh) * 2017-06-15 2020-11-10 成都优易数据有限公司 一种基于语义语气加权的倒排索引优化算法
CN111241259A (zh) * 2020-01-08 2020-06-05 百度在线网络技术(北京)有限公司 交互信息推荐方法和装置
CN111241259B (zh) * 2020-01-08 2023-06-20 百度在线网络技术(北京)有限公司 交互信息推荐方法和装置

Also Published As

Publication number Publication date
CN103530789B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
US11397772B2 (en) Information search method, apparatus, and system
EP3779841B1 (en) Method, apparatus and system for sending information, and computer-readable storage medium
US9589277B2 (en) Search service advertisement selection
US8990208B2 (en) Information management and networking
CN106709040B (zh) 一种应用搜索方法和服务器
TWI648642B (zh) Data search processing method and system
CN107424043A (zh) 一种产品推荐方法及装置,电子设备
CN105975632B (zh) 一种搜索方法、关系建立方法及相关设备
CN110020128A (zh) 一种搜索结果排序方法及装置
CN106982256A (zh) 信息推送方法、装置、设备及存储介质
JP6428795B2 (ja) モデル生成方法、単語重み付け方法、モデル生成装置、単語重み付け装置、デバイス、コンピュータプログラム及びコンピュータ記憶媒体
CN105335519A (zh) 模型生成方法及装置、推荐方法及装置
CN104933157A (zh) 用于获取用户属性信息的方法、装置及服务器
CN104462293A (zh) 搜索处理方法、生成搜索结果排序模型的方法和装置
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN103914468A (zh) 一种投放信息搜索的方法和装置
CN105677767A (zh) 一种设备配置推荐方法和装置
CN110490625A (zh) 用户偏好确定方法及装置、电子设备、存储介质
CN103593353A (zh) 信息搜索方法、展示信息排序权重值确定方法及其装置
CN108460082A (zh) 一种推荐方法及装置,电子设备
CN111639253B (zh) 一种数据判重方法、装置、设备及存储介质
CN105608125B (zh) 一种信息处理方法及服务器
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN106777282B (zh) 相关搜索的排序方法和装置
CN105808541B (zh) 一种信息匹配处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant