CN102810104B - 信息调整方法及装置 - Google Patents

信息调整方法及装置 Download PDF

Info

Publication number
CN102810104B
CN102810104B CN201110149832.6A CN201110149832A CN102810104B CN 102810104 B CN102810104 B CN 102810104B CN 201110149832 A CN201110149832 A CN 201110149832A CN 102810104 B CN102810104 B CN 102810104B
Authority
CN
China
Prior art keywords
information
clicked
weighted value
category
presenting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110149832.6A
Other languages
English (en)
Other versions
CN102810104A (zh
Inventor
王畅
黄慧
史健
谢锋
傅茂建
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110149832.6A priority Critical patent/CN102810104B/zh
Priority to TW100128692A priority patent/TWI498753B/zh
Priority to US13/484,049 priority patent/US8745042B2/en
Priority to PCT/US2012/040262 priority patent/WO2012166958A1/en
Priority to JP2014513707A priority patent/JP5624689B2/ja
Priority to EP12726316.8A priority patent/EP2715570A1/en
Publication of CN102810104A publication Critical patent/CN102810104A/zh
Priority to HK13100553.4A priority patent/HK1173523A1/zh
Application granted granted Critical
Publication of CN102810104B publication Critical patent/CN102810104B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种信息调整方法及装置,以解决可能出现对展现信息产生较大的误调整从而导致浪费处理资源的问题。包括:根据点击行为信息确定只展现但未被点击信息的总个数;为被点击信息分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,为被点击信息所属信息类别分配第一对应关系权重值;确定信息类别包含的只展现但未被点击信息的第一个数,并根据所述总个数和第一个数,为只展现但未被点击信息所属的各个信息类别分配第二对应关系权重值;并执行:根据第一原始权重值、第二原始权重值、第一对应关系权重值、第二对应关系权重值,确定所述匹配度;并根据匹配度调整展现信息。

Description

信息调整方法及装置
技术领域
本申请涉及互联网技术领域,尤其涉及一种信息调整方法及装置。
背景技术
目前,根据统计出的用户点击行为信息(比如,用户对于根据关键词搜索到的信息的点击行为信息、对于前台展示的信息的点击行为信息等),可以采用效果统计算法来确定信息类别与信息之间的匹配度。需要说明的是,这里的信息可以是指以声音、语言、文字、图像、动画等方式所表示的实际内容,而信息类别则可以看做是多个信息所具备的一种共同属性。比如,“上衣”、“连衣裙”、“短裤”、“长裤”等文字信息具备的共同属性可以为“服装”,则这些文字信息的信息类别可以为“服装”。又比如,包含有高山的图像、包含有瀑布的图像、包含有海洋的图像等图像信息所具备的共同属性可以为“风景”,则这些图片信息的信息类别可以为“风景”。一般地,在搜索领域中,输入的关键词可以看做是信息类别,而根据搜索到的与该关键词匹配的信息则可以看做是该信息类别包含的信息,比如,根据关键词“酒店”搜索到的“希尔顿酒店”、“香格里拉酒店”、“北京大酒店”等都可以看做是“酒店”这一信息类别所包含的信息。
在实际应用中,确定信息类别与信息之间的匹配度对于后续根据该匹配度确定关键词搜索命中率、确定信息排序/展现准确率、对信息类别所包含的信息进行调整(如从某一信息类别包含的信息中,删除掉与该信息类别匹配度较低的信息)等具有重要意义。
现有技术中提供的用于确定上述匹配度的效果统计算法比较简单,一般是直接根据用户点击的信息来确定用户点击的信息与相应的信息类别之间的匹配度。但现有技术提供的效果统计算法不会考虑被展现但未被用户点击的信息对于上述匹配度的贡献,从而其存在确定出的匹配度准确性不高的问题。
由于确定出的匹配度的准确性不高,进而也会使得根据该准确性不高的匹配度确定出的关键词搜索命中率、信息排序/展现准确率也是不准确的,这就相当于是浪费处理资源来得到了可用性较低的确定结果。并且,在根据该匹配度对信息类别所包含的展现信息进行调整时,也可能出现对展现信息产生较大的误调整从而浪费了处理资源。
发明内容
本申请实施例提供一种信息调整方法及装置,用以解决基于现有技术提供的效果统计算法得到的信息与信息所属类别的匹配度对展现信息进行调整时,可能出现对展现信息产生较大的误调整从而导致浪费处理资源的问题。
本申请实施例采用以下技术方案:
一种信息调整方法,包括:
从信息浏览日志中获取针对展现信息的点击行为信息,并根据所述点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,为被点击信息所属的各个信息类别分别分配第一对应关系权重值;确定各个只展现但未被点击信息所属的信息类别,并针对确定出的只展现但未被点击信息所属的任意信息类别,确定该信息类别包含的只展现但未被点击信息的第一个数,并根据所述总个数和所述第一个数,为只展现但未被点击信息所属的各个信息类别分配第二对应关系权重值;以及针对所述展现信息所属的任意信息类别,执行:确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据该信息类别包含的被点击信息被分配的第一原始权重值、该信息类别包含的只展现但未被点击信息被分配的第二原始权重值,以及该信息类别被分配的第一对应关系权重值和第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度;并根据确定的匹配度调整该信息类别包含的展现信息。
可选的,为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,具体包括:
确定展现信息中包含的被点击信息的总个数、只展现但未被点击信息的总个数;根据展现信息的总个数、被点击信息的总个数,确定第一原始权重值并分配给各个被点击信息;根据展现信息的总个数、只展现但未被点击信息的总个数,确定第二原始权重值并分配给各个只展现但未被点击信息。
可选的,根据所述任意信息类别包含的被点击信息被分配的第一原始权重值、该信息类别包含的只展现但未被点击信息被分配的第二原始权重值,以及该信息类别被分配的第一对应关系权重值和第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度,具体包括:
执行该信息类别包含的各个被点击信息被分配的第一原始权重值分别与该信息类别被分配的第一对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第一和值;并执行该信息类别包含的各个只展现但未被点击信息被分配的第二原始权重值分别与该信息类别被分配的第二对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第二和值;以及根据第一和值与第二和值之和,确定该信息类别与其包含的展现信息之间的匹配度。
可选的,根据确定的匹配度调整该信息类别包含的展现信息,具体包括:
判断确定的该信息类别与其包含的展现信息之间的匹配度是否低于预设的匹配度阈值;并在判断结果为是时,从该信息类别包含的非展现信息中选取信息;并利用选取的信息更新该信息类别所包含的展现信息。
可选的,所述点击行为信息为指定时间长度内的点击行为信息。
一种信息调整装置,包括:
信息和个数确定单元,用于从信息浏览日志中获取针对信息的点击行为信息,并根据所述点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;第一权重值分配单元,用于为信息和个数确定单元确定的各个被点击信息分别分配第一原始权重值,为信息和个数确定单元确定的只展现但未被点击信息分配第二原始权重值,为信息和个数确定单元确定的被点击信息所属的各个信息类别分别分配第一对应关系权重值;信息类别确定单元,用于确定信息和个数确定单元确定的各个只展现但未被点击信息所属的信息类别;第二权重值分配单元,用于针对信息类别确定单元确定出的只展现但未被点击信息所属的各个类别,分别确定各个类别包含的只展现但未被点击信息的第一个数,并根据所述总个数和所述第一个数,为只展现但未被点击信息所属的各个信息类别分别分配第二对应关系权重值;匹配度确定单元,用于针对所述展现信息所属的任意信息类别,执行:确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据第一权重值分配单元为该信息类别包含的被点击信息分配的第一原始权重值、为该信息类别包含的只展现但未被点击信息分配的第二原始权重值、为该信息类别分配的第一对应关系权重值和第二权重值分配单元为该信息类别分配的第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度;信息调整单元,用于针对所述展现信息所属的任意信息类别,执行:根据匹配度确定单元确定的该信息类别与其包含的展现信息之间的匹配度,调整该信息类别包含的展现信息。
本申请实施例的有益效果如下:
采用本申请实施例提供的上述方案,在确定信息类别与信息之间匹配度时,不仅体现了被点击信息对信息类别与信息之间匹配度的贡献度,还体现了只展现但未被点击的信息以及信息个数对该匹配度的贡献度,因此确定出的匹配度非常准确,进而基于该匹配度进行信息调整时也不会出现较大的误调整,从而解决了基于现有技术提供的效果统计算法得到的匹配度对信息进行调整时,可能导致出现较大误调整从而导致浪费处理资源的问题。
附图说明
图1为本申请实施例提供的一种信息调整方法的具体流程示意图;
图2为本申请实施例提供的方法应用于根据关键词进行信息搜索的场景下的具体应用流程图;
图3为本申请实施例提供的一种信息调整装置的具体结构示意图。
具体实施方式
为了解决基于现有技术提供的效果统计算法得到的信息与信息所属类别的匹配度对信息进行调整时,可能导致出现较大误调整从而导致浪费处理资源的问题,本申请实施例提供一种信息调整方案。该方案在确定信息类别与信息之间匹配度时,在考虑到被点击信息以及只展现但未被点击的信息都会为该匹配度做出贡献,以及被展现的分属不同信息类别的信息个数也会对该匹配度做出贡献的基础上,分别为不同展现信息分配相应的权重值,并进一步根据该权重值来确定信息类别与其包含的展现信息之间匹配度,从而能够根据该匹配度对展现信息进行准确调整。本申请实施例提供的该方案能够在体现被点击信息的贡献度的同时,充分体现只展现但未被点击的信息的贡献度,并且还能体现信息个数对于该匹配度的贡献度,从而能够非常准确地确定信息类别与信息之间匹配度,避免基于现有技术采用的方案得到的匹配度准确性不高而导致出现较大的信息误调整的问题。
以下结合附图,对本申请实施例提供的该方案进行详细说明。
本申请实施例首先提供一种信息调整方法,该方法的具体流程示意图如图1所示,包括以下步骤:
步骤11,从信息浏览日志中获取针对展现信息的点击行为信息,并根据该点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;
在本申请实施例中,展现信息可以为根据搜索关键词,利用搜索引擎搜索到并展现在用户终端显示屏上的信息,也可以为信息提供方直接显示在终端显示屏上的信息,比如商品卖家在终端显示屏上向买家展示的商品信息就可视为展现信息。
用户在对展现信息进行浏览时,会根据自身需求对某个或某些信息进行点击,这样就会在信息浏览中留下相应的记录,即上文所述的点击行为信息。可选的,这里的点击行为信息可以为指定时间长度内的点击行为信息。一般地,该指定时间长度越长,记录的行为信息会越多,则最终得到的匹配度的准确度越高。
步骤12,为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,为被点击信息所属的各个信息类别分别分配第一对应关系权重值;
本申请实施例中,第一原始权重值可以但不限于根据被点击信息在展现信息中所占比例来确定,而第二原始权重值可以但不限于根据只展现但未被点击信息在展现信息中所占比例来确定。比如,若展现信息总个数为20个,其中包含8个点击信息、12个只展现但未被点击信息,则第一原始权重值可以为8个点击信息在20个展现信息中所占比例,即0.4,而第二原始权重值可以为12个只展现但未被点击信息在20个展现信息中所占比例,即0.6。或者,可以将0.4扩大10倍变为4后作为第一原始权重值,而相应地,也可将0.6扩大10倍变为6后作为第二原始权重值。
而上述第一对应关系权重值的具体大小则可以是一个固定值。比如,本申请实施例中,就可以将该固定值设置为1。需要说明的是,这里的第一对应关系权重值与后文将要出现的为只展现但未被点击信息所属的各个信息类别分配的第二对应关系权重值是有一定联系的。一般地,为任一信息类别所分配的第二对应关系权重值是与属于该信息类别的只展现但未被点击信息在只展现但未被点击信息中所占比例有关的,而该比例一般不会超过1,即不会超过上述固定值。也就是说,按照上述设置方式,一般情况下,第二对应关系权重值与第一对应关系权重值的关系为:第二对应关系权重值≤第一对应关系权重值。不过,第一、第二对应关系权重值的设置是可以灵活变动的。按照另外的设置方式,也可能出现第二对应关系权重值≥第一对应关系权重值的情况。
步骤13,确定各个只展现但未被点击信息所属的信息类别,针对确定出的只展现但未被点击信息所属的任意信息类别,确定该信息类别包含的只展现但未被点击信息的第一个数,并根据步骤11中确定的只展现但未被点击信息的总个数和该第一个数,为只展现但未被点击信息所属的各个信息类别分配第二对应关系权重值;
前文已提到,第二对应关系权重值可以与只展现但未被点击信息的个数在只展现但未被点击信息的总个数的比例有关,具体来说,比如在20个展现信息中,若只展现但未被点击信息的总个数为12个,而某信息类别所包含的只展现但未被点击信息的个数为6,即该信息列别所包含的只展现但未被点击信息在只展现但未被点击信息中所占比例为0.5,那么该信息类别被分配的第二对应关系权重值就可以为0.5。
步骤14,针对展现信息所属的任意信息类别,执行下述操作:
确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据确定出的该信息类别包含的被点击信息被分配的第一原始权重值、确定出的该信息类别包含的只展现但未被点击信息被分配的第二原始权重值,以及该信息类别被分配的第一对应关系权重值和第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度,并根据确定的匹配度调整该信息类别包含的展现信息。
步骤14所述的操作的一种实现方式可以为:执行对该信息类别包含的各个被点击信息被分配的第一原始权重值分别与该信息类别被分配的第一对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第一和值;并执行对该信息类别包含的各个只展现但未被点击信息被分配的第二原始权重值分别与该信息类别被分配的第二对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第二和值;最后,根据第一和值与第二和值之和,就可以确定出该信息类别与其包含的展现信息之间的匹配度,从而根据该匹配度调整该信息类别包含的展现信息。
在一个较佳的实施例中,上述步骤12中为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值的具体过程可以为:
首先,从展现信息中确定被点击信息的总个数、只展现但未被点击信息的总个数;然后,根据展现信息的总个数、被点击信息的总个数,确定第一原始权重值并分配给各个被点击信息;最后,根据展现信息的总个数、只展现但未被点击信息的总个数,确定第二原始权重值并分配给各个只展现但未被点击信息。
本申请实施例提供的上述方法通过在确定信息类别与其包含的展现信息之间的匹配度时,不仅考虑到被点击的信息为该匹配度做出的贡献,还引入了只展现但未被点击的信息为该匹配度做出的贡献、被展现的分属不同类别的信息个数为该匹配度做出贡献,因此,可以大大提高确定出的匹配度的准确性,从而根据确定出的准确性较高的匹配度对展现信息进行调整就能够尽量避免产生较大的误调整,从而解决基于现有技术提供的效果统计算法得到的信息与信息所属类别的匹配度对信息进行调整时,可能导致出现较大误调整从而导致浪费处理资源的问题。
可选的,上述步骤14中所述的“根据确定的匹配度调整该信息类别包含的展现信息”的具体实现过程可以为:首先,判断该信息类别与其包含的展现信息之间的匹配度是否低于预设的匹配度阈值;然后,在判断结果为是时,从该信息类别包含的非展现信息中选取信息,并利用选取的信息更新该信息类别包含的展现信息。比如,针对共包含40条信息的信息类别A,若当前只对该信息类别A包含的20条信息进行了展现(即信息类别A包含的展现信息有20条,而包含非展现信息也有20条),并且确定出信息类别A与其包含的这20条展现信息之间的匹配度低于了匹配度阈值(比如为30%)。那么,就可以从信息类别A所包含的20条非展现信息中选取信息对信息类别A包含的展现信息进行替换。如可以从20条非展现信息中选取10条信息对展现信息中的10条只展现但未被点击信息进行替换,也可以选取全部的20条非展现信息对全部的20条展现信息进行替换。此外,还可以按照一次替换一条展现信息的方式,逐次从该信息类别包含的非展现信息中选取非展现信息对展现信息进行替换,并在每次替换后,都可以根据用户针对替换后的展现信息所产生的新的点击行为信息,确定该信息类别与其当前包含的展现信息(即替换后的展现信息)之间的匹配度,从而最终可以选择一个最大的匹配度所对应的展现信息作为一种较佳的信息集合进行长期展示。
通过根据信息类别与其包含的展现信息之间的匹配度对展现信息的动态调整,能够从展现信息中去除或替换掉用户不感兴趣的、与信息类别匹配程度不高的信息,而只将用户感兴趣的、与信息类别匹配程度较高的信息展现给用户,从而可以避免浪费处理资源来提供用户不感兴趣的信息的问题,同时还大大了提升用户的体验。
在实际应用中,在根据关键词进行信息搜索的场景下,采用本申请实施例提供的上述方案确定信息类别与信息之间匹配度的具体实现流程示意图如图2所示,包括如下步骤:
步骤21,对根据某一关键词进行一次搜索并呈现给用户的展现信息、展现信息对应的信息类别标识、用户针对展现信息的点击行为信息进行记录;
步骤22,根据记录的上述信息,确定展现信息的总个数,并确定被点击信息的总个数以及只展现但未被点击信息的总个数;
在本申请实施例中,可以假设确定出的展现信息总个数为10,被点击信息的总个数为3,只展现但未被点击信息的总个数为7;
步骤23,根据展现信息总个数、被用户点击的信息总个数以及只展现但未被点击的信息总个数,为被用户点击的信息分配原始权重值;
比如,根据展现信息总个数10,被用户点击的信息总个数3,只展现但未被点击的信息总个数7,为被用户点击的信息分配原始权重值3/10=0.3,该原始权重值可以记为Sctr。同时,为只展现但未被点击的信息分配原始权重值7/10=0.7,该原始权重值可以记为Sn。
步骤24,按照预设的对应关系权重值分配策略,为展现信息所属信息类别分别分配相应的对应关系权重值,其中,展现信息所属信息类别被分配的对应关系权重值大小可以与各信息类别与展现信息之间的匹配度成正比;
比如,假设上述3个被点击信息所属信息类别的标识分别为p_cate1、p_cate2、p_cate3,则按照预设的“为被点击信息所属信息类别分配的对应关系权重值=1”这样的对应关系权重值分配策略,可以为3个被点击信息所属信息类别分别分配对应关系权重值“1”。若将第n个信息类别被分配的对应关系权重值记为Rsctr(kw~p_caten),则根据上述分配策略,当n为1、2、3时,分别有如下式[1]、[2]、[3]这样的等式:
Rsctr(kw~p_cate1)=1                    [1]
Rsctr(kw~p_cate2)=1                    [2]
Rsctr(kw~p_cate3)=1                    [3]
而针对另外7个只展现但未被点击信息而言,则可以采用下述方式确定其分别所属的信息类别的对应关系权重值:
首先,确定这7个只展现但未被点击信息所分属的信息类别,比如,假设确定出这7个只展现但未被点击信息中,有4个信息是属于信息类别p_cate1,另外的3个信息则分属于信息类别p_cate2、p_cate3、p_cate4;
然后,按照“第n个信息类别被分配的对应关系权重值Rsn(kw~p_caten)=该信息类别所包含的只展现但未被点击信息的个数/只展现但未被点击信息的总个数”的计算方式,可以计算得到如下述公式[4]~[7]所示的信息类别p_cate1~p_cate4被分配的对应关系权重值:
Rsn(kw~p_cate1)=4/7=0.57                 [4]
Rsn(kw~p_cate2)=1/7=0.14            [5]
Rsn(kw~p_cate3)=1/7=0.14            [6]
Rsn(kw~p_cate4)=1/7=0.14            [7]
步骤25,根据确定的原始权重值和对应关系权重值,确定每个信息类别的信息类别权重值Kwa~p_caten,其中,Kwa~p_caten即体现了信息类别与其包含的展现信息之间的匹配度;
具体地,针对信息类别p_cate1,可以按照下述计算方式[8]计算在以关键词Kw1作为检索关键词的前提下为信息类别p_cate1所确定的信息类别权重值Kw1~p_cate1:
Kw1~p_cate1=Sctr×Rsctr(kw~p_cate1)+Sn×Rsn(kw~p_cate1)
=0.3×1+0.7×0.57                            [8]
=0.699
类似地,针对信息类别p_cate2、p_cate3、p_cate4,还可以计算出以关键词Kw1作为检索关键词的前提下的信息类别权重值Kw1:p_cate2、Kw1:p_cate3、Kw1:p_cate4,如下式[9]、[10]、[11]所示:
Kw1:p_cate2=Sctr×Rsctr(kw~p_cate2)+Sn×Rsn(kw~p_cate2)
=0.3×1+0.7×0.14                            [9]
=0.398
Kw1:p_cate3=Sctr×Rsctr(kw~p_cate3)+Sn×Rsn(kw~p_cate3)
=0.3×1+0.7×0.14                            [10]
=0.398
Kw1:p_cate4=Sctr×Rsctr(kw~p_cate4)+Sn×Rsn(kw~p_cate4)
=0+0.7×0.14                                  [11]
=0.098
上述步骤22~25是基于某一关键词进行一次搜索并对展现信息、展现信息对应的信息类别标识、用户基于展现信息的点击行为信息进行记录后进行的操作。此时可以直接根据上述信息类别权重值的具体数值0.699、0.398、0.398、0.098来确定信息类别与信息之间匹配度。按照原始权重值和对应关系权重值的分配方式可知,信息类别权重值越大,则该信息类别所包含的信息与该信息类别的匹配度越高;反之,则匹配度越低。
步骤26,针对任一信息类别,当根据其信息类别权重值Kwa~p_caten和预设的信息类别权重阈值确定出需要对该信息类别包含的展现信息进行调整时,执行调整展现信息的操作。
当考虑到需要保证结果的较高准确度时,在步骤21中,也可以是对一台服务器在一天24小时内针对同一关键词(或所有关键词)产生的上述信息进行记录,或者是对一台服务器在30天内针对同一关键词(或所有关键词)产生的上述信息进行记录,还可以是对多台服务器在指定时间长度内针对同一关键词(或所有关键词)产生的上述信息进行记录。一般说来,该指定时间长度越长,记录的信息越多,基于记录的信息所确定出的上述匹配度就会越准确。
在本申请实施例中,当记录了一台服务器在一天24小时内针对同一关键词Kwa进行的m次搜索并展现信息、展现信息对应的信息类别标识、用户基于展现信息的点击行为信息时,那么,在按照上述步骤22~25,实现分别根据每次搜索所记录的上述信息确定出各个信息类别的信息类别权重值之后,针对任意信息类别n,可以进一步采用下式[12]计算该信息类别n的m个信息类别权重值的平均值Dn(kwa~p_caten)。需要说明的是,为了便于描述,可以将基于关键词Kwa进行的第j次搜索所计算得到的、针对信息类别n的信息类别权重值可以记为Kwaj:p_caten,将相应的对应关系权重值记为Rsctrj(kwa~p_caten)和Rsnj(kwa~p_caten)。
Dn ( kwa ~ p _ caten ) = avg ( Σ j = 1 m Kw a j ~ p _ caten ) [12]
= avg ( Σ j = 1 m ( Sctr × Rsctr j ( kwa ~ p _ caten ) + Sn × Rs n j ( kwa ~ p _ caten )
根据计算出的Dn(kwa~p_caten),能够更准确地确定信息类别与其包含的信息之间的匹配度。与信息类别权重值与该匹配度的关系类似,Dn(kwa~p_caten)的值越大,则该信息类别n所包含的信息与该信息类别n的匹配度越高;反之,则匹配度越低。
此外,若需要进一步提高结果的准确度,还可以记录一台服务器在多天(比如为d天,d可以为10、30等)内针对同一关键词Kwa进行搜索并展现信息、展现信息对应的信息类别标识、用户基于展现信息的点击行为信息。假设按照上式[12]计算出的第i天的信息类别权重值的平均值记为Dni(kwa~p_caten)时,则针对信息类别n,可以计算得到d个Dni(kwa~p_caten)。此时,可以进一步按照下式[13]计算d个Dni(kwa~p_caten)的平均值Skweightdate(kwa~p_caten):
Skweightdate ( kwa ~ p _ caten ) = avg ( Σ i = 1 d Dn i ( kwa ~ p _ caten ) ) - - - [ 13 ]
根据计算出的Skweightdate(kwa~p_caten),就能够更为准确地确定信息类别与信息之间的匹配度。与信息类别权重值与该匹配度的关系类似,Skweightdate(kwa~p_caten)的值越大,则该信息类别n所包含的信息与该信息类别n的匹配度越高;反之,则匹配度越低。
在本申请实施例中,在计算出能够反映信息类别与信息之间匹配度的Kwa~p_caten、Dn(kwa~p_caten)或Skweightdate(kwa~p_caten)时,还可以根据计算出的这些值,进一步执行对信息的排序进行调整,和/或重新选取与信息类别匹配度较高的信息作为最能代表该信息类别的信息进行展示等操作。比如,针对任意信息类别A,当确定出信息类别A与其包含的展示信息之间的匹配度非常低时,可以重新选取信息类别A包含的非展示信息作为展示信息进行展示;又比如,针对信息类别B,当确定出信息类别B与其包含的展示信息之间的匹配度非常低时,可以将从信息类别B包含的非展现信息中选取信息并将选取的信息排列在与信息类别B匹配度不高的展示信息之前进行展示,等等。
需要说明的是,上述权重值的确定方式仅仅是实际应用中的一种具体情况。实际上,原始权重值和对应关系权重值的确定还可以采用除上述方式外的其他方式。比如,可以为被点击信息确定较小的原始权重值,而为只展现但未被点击信息确定较大的原始权重值,并且为被点击信息确定较小的对应关系权重值,而为只展现但未被点击信息确定较大的原始权重值。按照这样的权重值确定方式,则最终得到的信息类别权重值与上述匹配度的关系为:信息类别权重值越小,信息类别与信息之间的匹配度越高;反之,则越低。
本申请实施例提供的方案除了可以应用于根据关键词进行信息搜索的场景下,还可以应用于存在对分属于不同信息类别的信息进行展示这一需求的任意场景(比如商品信息展示场景)中。本申请实施例对该方案的应用场景不做限定。
对应于本发明实施例提供的信息调整方法,本发明实施例还提供一种信息调整装置,该装置的具体结构示意图如图3所示,包括以下功能单元:
信息和个数确定单元31,用于根据点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;
第一权重值分配单元32,用于为信息和个数确定单元31确定的各个被点击信息分别分配第一原始权重值,为信息和个数确定单元31确定的只展现但未被点击信息分配第二原始权重值,为信息和个数确定单元31确定的被点击信息所属的各个信息类别分别分配第一对应关系权重值;
信息类别确定单元33,用于确定信息和个数确定单元31确定的各个只展现但未被点击信息所属的信息类别;
第二权重值分配单元34,用于针对信息类别确定单元33确定出的只展现但未被点击信息所属的各个类别,分别确定各个类别包含的只展现但未被点击信息的第一个数,并根据上述展现信息的总个数和上述第一个数,为只展现但未被点击信息所属的各个信息类别分别分配第二对应关系权重值;
匹配度确定单元35,用于针对上述展现信息所属的任意信息类别,执行:确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据第一权重值分配单元32为该信息类别包含的被点击信息分配的第一原始权重值、为该信息类别包含的只展现但未被点击信息分配的第二原始权重值、为该信息类别分配的第一对应关系权重值和第二权重值分配单元34为该信息类别分配的第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度;
信息调整单元36,用于针对展现信息所属的任意信息类别,执行:根据匹配度确定单元35确定的该信息类别与其包含的展现信息之间的匹配度,调整该信息类别包含的展现信息。
对应于第一权重值分配单元32功能的一种实现方式,本发明实施例中可以将第一权重值分配单元32具体划分为以下功能模块,包括:
总个数确定模块,用于确定展现信息中包含的被点击信息的总个数、只展现但未被点击信息的总个数;
第一分配模块,用于根据总个数确定模块确定的展现信息的总个数、被点击信息的总个数,确定第一原始权重值并分配给各个被点击信息;
第二分配模块,用于根据总个数确定模块确定的展现信息的总个数、只展现但未被点击信息的总个数,确定第二原始权重值并分配给各个只展现但未被点击信息;
第三分配模块,用于为信息和个数确定单元确定的被点击信息所属的各个信息类别分别分配第一对应关系权重值。
可选的,对应于匹配度确定单元35功能的一种实现方式,本发明实施例中还可以将匹配度确定单元35具体划分为以下功能模块,包括:
第一和值确定模块,用于针对展现信息所属的任意信息类别,执行该信息类别包含的各个被点击信息被分配的第一原始权重值分别与该信息类别被分配的第一对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第一和值;
第二和值确定模块,用于执行该信息类别包含的各个只展现但未被点击信息被分配的第二原始权重值分别与该信息类别被分配的第二对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第二和值;
匹配度确定模块,用于根据第一和值确定模块确定的第一和值与第二和值确定模块确定的第二和值之和,确定该信息类别与其包含的展现信息之间的匹配度。
可选的,对应于信息调整单元36功能的一种实现方式,可以将其划分为以下功能模块,包括:判断模块,针对展现信息所属的任意信息类别,执行:判断匹配度确定单元确定的该信息类别与其包含的展现信息之间的匹配度是否低于预设的匹配度阈值;选取模块,用于在判断模块得到的判断结果为是时,从该信息类别包含的非展现信息中选取信息;更新模块,用于利用选取模块选取的信息更新该信息类别所包含的展现信息。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种信息调整方法,其特征在于,包括:
从信息浏览日志中获取针对展现信息的点击行为信息,并根据所述点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;
为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,为被点击信息所属的各个信息类别分别分配第一对应关系权重值;
确定各个只展现但未被点击信息所属的信息类别,并针对确定出的只展现但未被点击信息所属的任意信息类别,确定该信息类别包含的只展现但未被点击信息的第一个数,并根据所述总个数和所述第一个数,为只展现但未被点击信息所属的各个信息类别分配第二对应关系权重值;以及
针对所述展现信息所属的任意信息类别,执行:
确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据该信息类别包含的被点击信息被分配的第一原始权重值、该信息类别包含的只展现但未被点击信息被分配的第二原始权重值,以及该信息类别被分配的第一对应关系权重值和第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度;并根据确定的匹配度调整该信息类别包含的展现信息。
2.如权利要求1所述的方法,其特征在于,为各个被点击信息分别分配第一原始权重值,为只展现但未被点击信息分配第二原始权重值,具体包括:
确定展现信息中包含的被点击信息的总个数、只展现但未被点击信息的总个数;
根据展现信息的总个数、被点击信息的总个数,确定第一原始权重值并分配给各个被点击信息;
根据展现信息的总个数、只展现但未被点击信息的总个数,确定第二原始权重值并分配给各个只展现但未被点击信息。
3.如权利要求1所述的方法,其特征在于,根据所述任意信息类别包含的被点击信息被分配的第一原始权重值、该信息类别包含的只展现但未被点击信息被分配的第二原始权重值,以及该信息类别被分配的第一对应关系权重值和第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度,具体包括:
执行该信息类别包含的各个被点击信息被分配的第一原始权重值分别与该信息类别被分配的第一对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第一和值;并
执行该信息类别包含的各个只展现但未被点击信息被分配的第二原始权重值分别与该信息类别被分配的第二对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第二和值;以及
根据第一和值与第二和值之和,确定该信息类别与其包含的展现信息之间的匹配度。
4.如权利要求1~3任一所述的方法,其特征在于,根据确定的匹配度调整该信息类别包含的展现信息,具体包括:
判断确定的该信息类别与其包含的展现信息之间的匹配度是否低于预设的匹配度阈值;并
在判断结果为是时,从该信息类别包含的非展现信息中选取信息;并
利用选取的信息更新该信息类别所包含的展现信息。
5.如权利要求1~3任一所述的方法,其特征在于,所述点击行为信息为指定时间长度内的点击行为信息。
6.一种信息调整装置,其特征在于,包括:
信息和个数确定单元,用于从信息浏览日志中获取针对信息的点击行为信息,并根据所述点击行为信息,从展现信息中确定被点击信息和只展现但未被点击信息,并确定只展现但未被点击信息的总个数;
第一权重值分配单元,用于为信息和个数确定单元确定的各个被点击信息分别分配第一原始权重值,为信息和个数确定单元确定的只展现但未被点击信息分配第二原始权重值,为信息和个数确定单元确定的被点击信息所属的各个信息类别分别分配第一对应关系权重值;
信息类别确定单元,用于确定信息和个数确定单元确定的各个只展现但未被点击信息所属的信息类别;
第二权重值分配单元,用于针对信息类别确定单元确定出的只展现但未被点击信息所属的各个类别,分别确定各个类别包含的只展现但未被点击信息的第一个数,并根据所述总个数和所述第一个数,为只展现但未被点击信息所属的各个信息类别分别分配第二对应关系权重值;
匹配度确定单元,用于针对所述展现信息所属的任意信息类别,执行:确定该信息类别包含的被点击信息和只展现但未被点击信息,并根据第一权重值分配单元为该信息类别包含的被点击信息分配的第一原始权重值、为该信息类别包含的只展现但未被点击信息分配的第二原始权重值、为该信息类别分配的第一对应关系权重值和第二权重值分配单元为该信息类别分配的第二对应关系权重值,确定该信息类别与其包含的展现信息之间的匹配度;
信息调整单元,用于针对所述展现信息所属的任意信息类别,执行:根据匹配度确定单元确定的该信息类别与其包含的展现信息之间的匹配度,调整该信息类别包含的展现信息。
7.如权利要求6所述的装置,其特征在于,所述第一权重值分配单元具体包括:
总个数确定模块,用于确定展现信息中包含的被点击信息的总个数、只展现但未被点击信息的总个数;
第一分配模块,用于根据总个数确定模块确定的展现信息的总个数、被点击信息的总个数,确定第一原始权重值并分配给各个被点击信息;
第二分配模块,用于根据总个数确定模块确定的展现信息的总个数、只展现但未被点击信息的总个数,确定第二原始权重值并分配给各个只展现但未被点击信息;
第三分配模块,用于为信息和个数确定单元确定的被点击信息所属的各个信息类别分别分配第一对应关系权重值。
8.如权利要求6所述的装置,其特征在于,所述匹配度确定单元具体包括:
第一和值确定模块,用于针对所述展现信息所属的任意信息类别,执行该信息类别包含的各个被点击信息被分配的第一原始权重值分别与该信息类别被分配的第一对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第一和值;并
第二和值确定模块,用于执行该信息类别包含的各个只展现但未被点击信息被分配的第二原始权重值分别与该信息类别被分配的第二对应关系权重值相乘,并对所有相乘结果进行相加的操作,得到第二和值;
匹配度确定模块,用于根据第一和值确定模块确定的第一和值与第二和值确定模块确定的第二和值之和,确定该信息类别与其包含的展现信息之间的匹配度。
9.如权利要求6~8任一所述的装置,其特征在于,所述信息调整单元具体包括:
判断模块,针对所述展现信息所属的任意信息类别,执行:判断匹配度确定单元确定的该信息类别与其包含的展现信息之间的匹配度是否低于预设的匹配度阈值;
选取模块,用于在判断模块得到的判断结果为是时,从该信息类别包含的非展现信息中选取信息;
更新模块,用于利用选取模块选取的信息更新该信息类别所包含的展现信息。
10.如权利要求6~8任一所述的装置,其特征在于,所述点击行为信息为指定时间长度内的点击行为信息。
CN201110149832.6A 2011-06-03 2011-06-03 信息调整方法及装置 Expired - Fee Related CN102810104B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201110149832.6A CN102810104B (zh) 2011-06-03 2011-06-03 信息调整方法及装置
TW100128692A TWI498753B (zh) 2011-06-03 2011-08-11 Information adjustment method and device
US13/484,049 US8745042B2 (en) 2011-06-03 2012-05-30 Determining matching degrees between information categories and displayed information
JP2014513707A JP5624689B2 (ja) 2011-06-03 2012-05-31 情報カテゴリおよび表示情報の間の一致度の決定
PCT/US2012/040262 WO2012166958A1 (en) 2011-06-03 2012-05-31 Determining matching degrees between information categories and displayed information
EP12726316.8A EP2715570A1 (en) 2011-06-03 2012-05-31 Determining matching degrees between information categories and displayed information
HK13100553.4A HK1173523A1 (zh) 2011-06-03 2013-01-14 信息調整方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110149832.6A CN102810104B (zh) 2011-06-03 2011-06-03 信息调整方法及装置

Publications (2)

Publication Number Publication Date
CN102810104A CN102810104A (zh) 2012-12-05
CN102810104B true CN102810104B (zh) 2015-05-20

Family

ID=47233811

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110149832.6A Expired - Fee Related CN102810104B (zh) 2011-06-03 2011-06-03 信息调整方法及装置

Country Status (7)

Country Link
US (1) US8745042B2 (zh)
EP (1) EP2715570A1 (zh)
JP (1) JP5624689B2 (zh)
CN (1) CN102810104B (zh)
HK (1) HK1173523A1 (zh)
TW (1) TWI498753B (zh)
WO (1) WO2012166958A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2722805A1 (en) * 2012-10-19 2014-04-23 Telefonica S.A. A user-profiling method for providing advertisement data and/or online content to a user and a computer program
CN106919692B (zh) * 2017-03-07 2021-02-19 阿里巴巴(中国)有限公司 一种推送消息的方法和装置
CN107506463B (zh) * 2017-08-30 2020-08-18 宁波城市职业技术学院 一种数据分类和处理方法及设备
CN114268626A (zh) * 2020-09-16 2022-04-01 阿里巴巴集团控股有限公司 窗口处理系统、方法以及装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US6618722B1 (en) * 2000-07-24 2003-09-09 International Business Machines Corporation Session-history-based recency-biased natural language document search
DE60335472D1 (de) 2002-07-23 2011-02-03 Quigo Technologies Inc System und verfahren zur automatisierten abbildung von schlüsselwörtern und schlüsselphrasen auf dokumenten
US7634472B2 (en) * 2003-12-01 2009-12-15 Yahoo! Inc. Click-through re-ranking of images and other data
US7444327B2 (en) * 2004-01-09 2008-10-28 Microsoft Corporation System and method for automated optimization of search result relevance
US7925657B1 (en) * 2004-03-17 2011-04-12 Google Inc. Methods and systems for adjusting a scoring measure based on query breadth
JP4453437B2 (ja) * 2004-05-11 2010-04-21 日本電信電話株式会社 検索キーワード順位付け方法及び装置及びプログラム
US20050256848A1 (en) * 2004-05-13 2005-11-17 International Business Machines Corporation System and method for user rank search
US7788260B2 (en) * 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
KR100806862B1 (ko) 2004-07-16 2008-02-26 (주)이네스트커뮤니케이션 웹 사이트에서의 1차 키워드 검색에 대해 관련성 있는 2차키워드의 리스트를 제공하는 방법 및 장치
US8903827B2 (en) 2004-10-29 2014-12-02 Ebay Inc. Method and system for categorizing items automatically
US7617193B2 (en) * 2005-03-28 2009-11-10 Elan Bitan Interactive user-controlled relevance ranking retrieved information in an information search system
US8060463B1 (en) * 2005-03-30 2011-11-15 Amazon Technologies, Inc. Mining of user event data to identify users with common interests
US7844590B1 (en) * 2005-06-16 2010-11-30 Eightfold Logic, Inc. Collection and organization of actual search results data for particular destinations
CN101311922A (zh) * 2007-05-25 2008-11-26 百度在线网络技术(北京)有限公司 广告模板样式匹配方法及系统
US7716218B1 (en) * 2007-07-20 2010-05-11 Oracle America, Inc. Method and system for enhanced search engine tuning
KR100898458B1 (ko) * 2007-08-10 2009-05-21 엔에이치엔(주) 정보 검색 방법 및 그 시스템
US8515035B2 (en) * 2007-10-01 2013-08-20 Ingenio Llc Systems and methods to connect people for real time communications
JP2009146248A (ja) * 2007-12-17 2009-07-02 Fujifilm Corp コンテンツ提示システム及びプログラム
CN101551806B (zh) * 2008-04-03 2012-04-18 北京搜狗科技发展有限公司 一种个性化网址导航的方法和系统
US8589395B2 (en) * 2008-04-15 2013-11-19 Yahoo! Inc. System and method for trail identification with search results
US20090271374A1 (en) * 2008-04-29 2009-10-29 Microsoft Corporation Social network powered query refinement and recommendations
US20100070339A1 (en) 2008-09-15 2010-03-18 Google Inc. Associating an Entity with a Category
US8185544B2 (en) * 2009-04-08 2012-05-22 Google Inc. Generating improved document classification data using historical search results
TWI446191B (zh) * 2009-07-06 2014-07-21 Alibaba Group Holding Ltd Word matching and information query method and device
US9215420B2 (en) * 2010-06-01 2015-12-15 Comcast Cable Communications, Llc Ranking search results
US8818981B2 (en) * 2010-10-15 2014-08-26 Microsoft Corporation Providing information to users based on context

Also Published As

Publication number Publication date
EP2715570A1 (en) 2014-04-09
TW201250490A (en) 2012-12-16
WO2012166958A1 (en) 2012-12-06
JP2014517404A (ja) 2014-07-17
US8745042B2 (en) 2014-06-03
JP5624689B2 (ja) 2014-11-12
CN102810104A (zh) 2012-12-05
US20120310932A1 (en) 2012-12-06
TWI498753B (zh) 2015-09-01
HK1173523A1 (zh) 2013-05-16

Similar Documents

Publication Publication Date Title
CN110489644B (zh) 信息推送方法、装置、计算机可读存储介质和计算机设备
US20200334691A1 (en) System and Method for Providing On-Line Advertising with Dynamic Content
JP5139218B2 (ja) コンテンツ出力装置、コンテンツ出力プログラムおよびコンテンツ出力方法
US20180012248A1 (en) Real time audience forecasting
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
US20110238758A1 (en) Method And Apparatus For Displaying Feeds Content Of Contact And Processing Apparatus And System Thereof
CN108090208A (zh) 融合数据处理方法及装置
CN111262953A (zh) 一种实时推送信息的方法和装置
CN102810104B (zh) 信息调整方法及装置
CN101840558A (zh) 互联网广告提供方法及互联网广告提供系统
WO2021184913A1 (zh) 点单方法、订单的配送方法、装置及系统
US8095482B2 (en) System and method to learn and deploy an optimal user experience in an online system
CN107220848A (zh) 一种广告展示方法和装置
CN103379161B (zh) 媒体信息展示方法、系统和装置
JP2011192224A (ja) 数値計算装置、方法及びプログラム
CN104537095A (zh) 一种基于吸引力模型的信息精准推送方法和系统
JP2011227720A (ja) 推薦システム、推薦方法、及び推薦プログラム
CN109254812A (zh) 一种更新标签页的方法、系统、终端及服务器
CN114547416A (zh) 一种媒体资源排序方法及电子设备
CN107688956A (zh) 一种信息处理方法及服务器
CN104537104A (zh) 软件排序方法及系统
CN113360765B (zh) 事件信息的处理方法、装置、电子设备和介质
CN112801697B (zh) 多媒体数据的数据关联窗口的调节方法及装置
JP7493856B1 (ja) 集客支援装置、集客支援システム、集客支援方法、及びプログラム
CN111767497B (zh) 用于处理信息的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1173523

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1173523

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150520

CF01 Termination of patent right due to non-payment of annual fee