CN110750717B - 一种排序权重更新方法 - Google Patents

一种排序权重更新方法 Download PDF

Info

Publication number
CN110750717B
CN110750717B CN201910927762.9A CN201910927762A CN110750717B CN 110750717 B CN110750717 B CN 110750717B CN 201910927762 A CN201910927762 A CN 201910927762A CN 110750717 B CN110750717 B CN 110750717B
Authority
CN
China
Prior art keywords
articles
browsing
conversion rate
time
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910927762.9A
Other languages
English (en)
Other versions
CN110750717A (zh
Inventor
季飞
杨晶生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Microphone Culture Media Co ltd
Original Assignee
Shanghai Microphone Culture Media Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Microphone Culture Media Co ltd filed Critical Shanghai Microphone Culture Media Co ltd
Priority to CN201910927762.9A priority Critical patent/CN110750717B/zh
Publication of CN110750717A publication Critical patent/CN110750717A/zh
Application granted granted Critical
Publication of CN110750717B publication Critical patent/CN110750717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0603Catalogue ordering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种排序权重更新方法,涉及排序算法技术领域。本发明包括以下步骤:步骤一、输入需要搜索的物品,提取物品中描述的关键词;步骤二、利用TF‑IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;本发明通过调用数据库中采集的数据,对物品进行实时曝光加权,再配合时间衰减算法更新排序权重,一方面可以增加优质物品的曝光几率,减小数据拨动几率,另一方面,可以增加新物品的曝光权重,从而防止新物品的曝光几率过低。

Description

一种排序权重更新方法
技术领域
本发明涉及排序算法技术领域,具体为一种排序权重更新方法。
背景技术
综合排序算法指的是一种信息系统输出的计算方法,它根据用户输入、用户特征和当前场景等因素来评估结果跟用户意图的相关性,并根据相关性和重要性对结果进行打分排序,从而返回用户最需要的结果。
目前的综合排序方法通常采用单一特征的排序原理,排序算法中并没有涉及多个特征,单个特征的优劣不能代表排序物品的实际综合表现情况,只考虑特征的短期表现,容易缺乏特征历史的数据,导致特征数据的波动很大,从而导致特征的参考性降低;同时,若特征采用长期的累计值会出现特征的变化很小,综合排行结果长期不变,使得新进物品的曝光几率过低,因此研发一种可以结合多个特征且实时更新的排序方法是本领域技术人员需要解决的技术问题。
发明内容
针对现有技术的不足,本发明提供了一种排序权重更新方法,解决了上述背景技术中提出的问题。
为实现以上目的,本发明通过以下技术方案予以实现:一种排序权重更新方法,包括以下步骤:
步骤一、输入需要搜索的物品,提取物品中描述的关键词;
步骤二、利用TF-IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;
步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;
步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;
步骤五、后天调用程序根据所得物品转化率、物品详细内容的浏览量和浏览时间对所有物品进行重新排序,针对物品转化率高、物品详细内容的浏览量多和浏览时间长的物品进行曝光加权;
步骤六、重新排序后的结果加入时间衰减算法,计算完成后重新跳转至步骤四。
进一步地,所述TF-IDF算法包括以下公式:
需要说明的是,上述公式中分子是关键词在物品特征内容中的出现次数,而分母则是在物品特征内容中所有关键词出现次数之和。
进一步地,所述时间衰减算法包括以下公式:
需要说明的是,统计30天物品关键词出现的数据特征值为day_num,加入时间衰减算法可以避免新物品曝光几率过低。
进一步地,所述特征内容为物品详细页面中的详细内容介绍,所述属性标签为消费者评价体系中出现的高频词汇,所述特征内容与属性标签均通过python爬虫程序从网页中抓取。
进一步地,所述物品转化率包括消费者点击物品链接的转化率、发送询盘的转化率以及购买物品的转化率,所述物品详细内容的浏览量为消费者浏览页面的长度,所述浏览时间为消费者浏览页面的时间长短,通过上述采集内容可以判断物品的质量优劣,需要说明的是,物品包括可生产销售的商品以及商品相关的评测内容。
进一步地,所述后台调用程序为基于C++编写的快速排序算法,所述调用数据库为基于IPv6的云服务器。
本发明具有以下有益效果:
1、该排序权重更新方法,通过调用数据库中采集的多种特征数据,对物品进行实时曝光加权,再配合时间衰减算法更新排序权重,一方面可以增加优质物品的曝光几率,减小数据拨动几率,另一方面,可以增加新物品的曝光权重,从而防止新物品的曝光几率过低。
2、该排序权重更新方法,通过依据物品转化率、物品详细内容的浏览量和浏览时间的数据判断物品排序权重,有利于排序算法优化排序名次,便于消费者更加全面且快速的获取物品信息。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种排序权重更新方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明提供一种技术方案:一种排序权重更新方法,包括以下步骤:
步骤一、输入需要搜索的物品,提取物品中描述的关键词;
步骤二、利用TF-IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;
步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;
步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;
步骤五、后天调用程序根据所得物品转化率、物品详细内容的浏览量和浏览时间对所有物品进行重新排序,针对物品转化率高、物品详细内容的浏览量多和浏览时间长的物品进行曝光加权;
步骤六、重新排序后的结果加入时间衰减算法,计算完成后重新跳转至步骤四。
其中,TF-IDF算法包括以下公式:
需要说明的是,上述公式中分子是关键词在物品特征内容中的出现次数,而分母则是在物品特征内容中所有关键词出现次数之和。
其中,时间衰减算法包括以下公式:
需要说明的是,统计30天物品关键词出现的数据特征值为day_num,加入时间衰减算法可以提高新物品的排序权重,从而避免新物品曝光几率过低。
其中,特征内容为物品详细页面中的详细内容介绍,属性标签为消费者评价体系中出现的高频词汇,特征内容与属性标签均通过python爬虫程序从网页中抓取。
其中,物品转化率包括消费者点击物品链接的转化率、发送询盘的转化率以及购买物品的转化率,物品详细内容的浏览量为消费者浏览页面的长度,浏览时间为消费者浏览页面的时间长短,通过上述采集内容可以判断物品的质量优劣,需要说明的是,物品包括可生产销售的商品以及商品相关的评测内容。
其中,后台调用程序为基于C++编写的快速排序算法,调用数据库为基于IPv6的云服务器。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种排序权重更新方法,其特征在于包括以下步骤:
步骤一、输入需要搜索的物品,提取物品中描述的关键词;
步骤二、利用TF-IDF算法提取物品介绍中的特征内容与属性标签与关键词相匹配;
步骤三、根据算法计算出所有物品的排序权重,按照权重从大到小进行初次排序;
步骤四、后台调用程序实时采集物品转化率、物品详细内容的浏览量和浏览时间,采集的信息储存至调用数据库中;
步骤五、后台调用程序根据所得物品转化率、物品详细内容的浏览量和浏览时间对所有物品进行重新排序,针对物品转化率高、物品详细内容的浏览量多和浏览时间长的物品进行曝光加权;
步骤六、重新排序后的结果加入时间衰减算法,计算完成后重新跳转至步骤四;
其中,所述TF-IDF算法包括以下公式:
所述时间衰减算法包括以下公式:
所述特征内容为物品详细页面中的详细内容介绍,所述属性标签为消费者评价体系中出现的高频词汇,所述特征内容与属性标签均通过python爬虫程序从网页中抓取。
2.根据权利要求1所述的一种排序权重更新方法,其特征在于,所述物品转化率包括消费者点击物品链接的转化率、发送询盘的转化率以及购买物品的转化率,所述物品详细内容的浏览量为消费者浏览页面的长度,所述浏览时间为消费者浏览页面的时间长短。
3.根据权利要求1所述的一种排序权重更新方法,其特征在于,所述后台调用程序为基于C++编写的快速排序算法,所述调用数据库为基于IPv6的云服务器。
CN201910927762.9A 2019-09-27 2019-09-27 一种排序权重更新方法 Active CN110750717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910927762.9A CN110750717B (zh) 2019-09-27 2019-09-27 一种排序权重更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910927762.9A CN110750717B (zh) 2019-09-27 2019-09-27 一种排序权重更新方法

Publications (2)

Publication Number Publication Date
CN110750717A CN110750717A (zh) 2020-02-04
CN110750717B true CN110750717B (zh) 2024-02-02

Family

ID=69277403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910927762.9A Active CN110750717B (zh) 2019-09-27 2019-09-27 一种排序权重更新方法

Country Status (1)

Country Link
CN (1) CN110750717B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450168A (zh) * 2020-03-27 2021-09-28 北京沃东天骏信息技术有限公司 数据处理方法、装置及计算机可读存储介质
CN111881341B (zh) * 2020-06-15 2022-11-25 合肥美的电冰箱有限公司 饮食信息推荐方法及装置、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006221A (ja) * 2001-06-20 2003-01-10 Masakatsu Morii 予測分析型検索システム、予測分析型検索方法およびコンピュータプログラム
CN108182186A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于随机森林算法的网页排序方法
CN108230051A (zh) * 2018-02-12 2018-06-29 昆山数泰数据技术有限公司 一种基于标签权重算法的用户对商品关注度的确定方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006221A (ja) * 2001-06-20 2003-01-10 Masakatsu Morii 予測分析型検索システム、予測分析型検索方法およびコンピュータプログラム
CN108182186A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于随机森林算法的网页排序方法
CN108230051A (zh) * 2018-02-12 2018-06-29 昆山数泰数据技术有限公司 一种基于标签权重算法的用户对商品关注度的确定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贾丽柯 ; .基于校园网的搜索引擎排序算法研究.商丘职业技术学院学报.2008,(02),全文. *

Also Published As

Publication number Publication date
CN110750717A (zh) 2020-02-04

Similar Documents

Publication Publication Date Title
TWI609278B (zh) Method and system for recommending search words
US9934293B2 (en) Generating search results
WO2015188699A1 (zh) 推荐项目的方法和装置
CN108460082B (zh) 一种推荐方法及装置,电子设备
CN105701216A (zh) 一种信息推送方法及装置
CN112307762B (zh) 搜索结果的排序方法及装置、存储介质、电子装置
CN103544216A (zh) 一种结合图像内容和关键字的信息推荐方法及系统
CN104268142B (zh) 基于可拒绝策略的元搜索结果排序方法
CN102456058A (zh) 类目信息提供方法及装置
CN102043833A (zh) 一种基于查询词进行搜索的方法和搜索装置
CN103679462A (zh) 一种评论数据处理方法和装置、一种搜索方法和系统
EP2480995A1 (en) Searching for information based on generic attributes of the query
CN102779193A (zh) 自适应个性化信息检索系统及方法
CN105630827B (zh) 一种信息处理方法、系统及辅助系统
WO2014085776A2 (en) Web search ranking
CN110287420A (zh) 一种信息推荐系统的训练方法及装置
EP2524344A1 (en) Matching of advertising sources and keyword sets in online commerce platforms
CN110688565B (zh) 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN110750717B (zh) 一种排序权重更新方法
CN103309869A (zh) 数据对象的展示关键词推荐方法及系统
CN112148973A (zh) 一种信息推送的数据处理方法及装置
CN110516033A (zh) 一种计算用户偏好的方法和装置
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置
KR102122122B1 (ko) 기사 검색을 이용한 물가 예측 시스템 및 방법
CN101840438A (zh) 面向源文献元关键词的检索系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant