CN110765103A - 一种多个排序方法的组合流程及系统 - Google Patents

一种多个排序方法的组合流程及系统 Download PDF

Info

Publication number
CN110765103A
CN110765103A CN201910926665.8A CN201910926665A CN110765103A CN 110765103 A CN110765103 A CN 110765103A CN 201910926665 A CN201910926665 A CN 201910926665A CN 110765103 A CN110765103 A CN 110765103A
Authority
CN
China
Prior art keywords
sorting
sequencing
sort
ordering
content library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910926665.8A
Other languages
English (en)
Inventor
季飞
杨晶生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Microphone Culture Media Co Ltd
Original Assignee
Shanghai Microphone Culture Media Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Microphone Culture Media Co Ltd filed Critical Shanghai Microphone Culture Media Co Ltd
Priority to CN201910926665.8A priority Critical patent/CN110765103A/zh
Publication of CN110765103A publication Critical patent/CN110765103A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于排序方法组合技术领域,尤其是涉及一种多个排序方法的组合流程及系统,包括以下步骤:设计多个不同的排序算法包括热门、上新、购买等;构建内容库,每个内容库关联属性或分类筛选出待排序的专辑;配置组件使用的内容库,选择排序算法及每个排序算法对应的个数;对组件中的每个排序算出排序结果;对排序结果进行合并去重。本发明提出一种排序装置支持多个排序方法组合成最终结果,满足不同的业务述求,自由灵活配置一个排序组件中各个排序算法输出的个数或者配比,既满足了热度,又满足了新品的曝光需求。

Description

一种多个排序方法的组合流程及系统
技术领域
本发明涉及排序方法组合技术领域,尤其涉及一种多个排序方法的组合流程及系统。
背景技术
在现有技术中,随着互联网的发展,越来越多的网站引入了用户生成内容功能,大量的网民涌入论坛、博客、微博中发表自己的意见和爆料各类新闻,每天有成千上万的话题从互联网上产生,如何更快速的从互联网海量信息中获取网络热点,将对了解社会发展形势、掌握舆论动态起到指导性作用。
在实际业务中,常常会使用排序,通常的排序按照某个特定排序分值结果进行排序,而排序分值接近的专辑,特征也很容易接近,导致结果缺乏多样性,满足不同的述求。
为此,我们提出一种多个排序方法的组合流程来解决上述问题。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种多个排序方法的组合流程及系统。
为了实现上述目的,本发明采用了如下技术方案:
一种多个排序方法的组合流程,包括以下步骤:
S1、设计多个不同的排序算法包括热门、上新、购买等;
S2、构建内容库,每个内容库关联属性或分类筛选出待排序的专辑;
S3、配置组件使用的内容库,选择排序算法及每个排序算法对应的个数;
S4、对组件中的每个排序算出排序结果;
S5、对排序结果进行合并去重。
3、在上述的一种多个排序方法的组合流程中,所述组合装置包括以下模块:
专辑模块,用于存放专辑的元信息,包括专辑的名称,标题,分类,属性等;
内容库模块,用于对专辑的聚合可以是基于分类、属性或者交叉;
排序模块,用于对内容进行排序;
排序组件模块,用于内容库的装载和内容库数据的计算;
排序组件展示模块,用于对结果进行聚合、过滤、组装以及输出展示。
在上述的一种多个排序方法的组合流程中,所述排序模块包含基本排序模型的设置单元,模型训练单元和排序模型生成单元。
在上述的一种多个排序方法的组合流程中,所述排序组件模块包括装载单元和计算单元,所述装载单元用于将排序模型和内容库装载进来,且计算单元用于对内容库数据进行排序。
在上述的一种多个排序方法的组合流程中,所述排序算法包括冒泡排序、选择排序、快速排序、插入排序、希尔排序、桶排序、基数排序、归并排序和堆排序。
在上述的一种多个排序方法的组合流程中,所述冒泡排序、插入排序、基数排序、桶排序和归并排序的稳定性强于选择排序、快速排序、希尔排序和堆排序的稳定性。
在上述的一种多个排序方法的组合流程中,所述冒泡排序、选择排序和插入排序的时间复杂度为O(N2),所述快速排序、归并排序和堆排序的时间复杂度为O(NlogN),所述希尔排序的时间复杂度通常认为是O(N3/2),所述桶排序和基数排序的时间复杂度为O(x*N)。
与现有技术相比,本一种多个排序方法的组合流程的优点在于:
1、本发明将不同的排序算法融合在一起,满足不同的述求,且内容库的构建实现了内容的自由组合。
2、本发明支持多个排序方法组合成最终结果,满足不同的业务述求,自由灵活配置一个排序组件中各个排序算法输出的个数或者配比,既满足了热度,又满足了新品的曝光需求。
附图说明
图1为本发明提出的一种多个排序方法的组合流程的方法步骤图;
图2为本发明提出的一种多个排序方法的组合流程的算法结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-2,一种多个排序方法的组合流程,包括以下步骤:
S1、设计多个不同的排序算法包括热门、上新、购买等;
S2、构建内容库,每个内容库关联属性或分类筛选出待排序的专辑;
S3、配置组件使用的内容库,选择排序算法及每个排序算法对应的个数;
S4、对组件中的每个排序算出排序结果;
S5、对排序结果进行合并去重。
其中,所述组合系统包括以下模块:
专辑模块,用于存放专辑的元信息,包括专辑的名称,标题,分类,属性等;
内容库模块,用于对专辑的聚合可以是基于分类、属性或者交叉;
排序模块,用于对内容进行排序;
排序组件模块,用于内容库的装载和内容库数据的计算;
排序组件展示模块,用于对结果进行聚合、过滤、组装以及输出展示。
具体的,排序模块包含基本排序模型的设置单元,模型训练单元和排序模型生成单元,排序组件模块包括装载单元和计算单元,装载单元用于将排序模型和内容库装载进来,且计算单元用于对内容库数据进行排序。
其中,本发明中的排序算法包括:
冒泡排序:依次比较相邻两元素,若前一元素大于后一元素则交换之,直至最后一个元素即为最大;然后重新从首元素开始重复同样的操作,直至倒数第二个元素即为次大元素;依次类推。如同水中的气泡,依次将最大或最小元素气泡浮出水面。
选择排序:首先初始化最小元素索引值为首元素,依次遍历待排序数列,若遇到小于该最小索引位置处的元素则刷新最小索引为该较小元素的位置,直至遇到尾元素,结束一次遍历,并将最小索引处元素与首元素交换;然后,初始化最小索引值为第二个待排序数列元素位置,同样的操作,可得到数列第二个元素即为次小元素;以此类推。
快速排序:选一基准元素,依次将剩余元素中小于该基准元素的值放置其左侧,大于等于该基准元素的值放置其右侧;然后,取基准元素的前半部分和后半部分分别进行同样的处理;以此类推,直至各子序列剩余一个元素时,即排序完成。
插入排序:数列前面部分看为有序,依次将后面的无序数列元素插入到前面的有序数列中,初始状态有序数列仅有一个元素,即首元素。在将无序数列元素插入有序数列的过程中,采用了逆序遍历有序数列,相较于顺序遍历会稍显繁琐,但当数列本身已近排序状态效率会更高。
希尔排序:插入排序的改进版。为了减少数据的移动次数,在初始序列较大时取较大的步长,通常取序列长度的一半,此时只有两个元素比较,交换一次;之后步长依次减半直至步长为1,即为插入排序,由于此时序列已接近有序,故插入元素时数据移动的次数会相对较少,效率得到了提高。
桶排序:实现线性排序,但当元素间值得大小有较大差距时会带来内存空间的较大浪费。首先,找出待排序列中得最大元素max,申请内存大小为max+1的桶(数组)并初始化为0;然后,遍历排序数列,并依次将每个元素作为下标的桶元素值自增1;最后,遍历桶元素,并依次将值非0的元素下标值载入排序数列(桶元素>1表明有值大小相等的元素,此时依次将他们载入排序数列),遍历完成,排序数列便为有序数列。
基数排序:桶排序的改进版,桶的大小固定为10,减少了内存空间的开销。首先,找出待排序列中得最大元素max,并依次按max的低位到高位对所有元素排序;桶元素10个元素的大小即为待排序数列元素对应数值为相等元素的个数,即每次遍历待排序数列,桶将其按对应数值位大小分为了10个层级,桶内元素值得和为待排序数列元素个数。
归并排序:采用了分治和递归的思想,递归&分治-排序整个数列如同排序两个有序数列,依次执行这个过程直至排序末端的两个元素,再依次向上层输送排序好的两个子列进行排序直至整个数列有序。
堆排序:堆排序的思想借助于二叉堆中的最大堆得以实现。首先,将待排序数列抽象为二叉树,并构造出最大堆;然后,依次将最大元素(即根节点元素)与待排序数列的最后一个元素交换(即二叉树最深层最右边的叶子结点元素);每次遍历,刷新最后一个元素的位置(自减1),直至其与首元素相交,即完成排序。
其中,冒泡排序、插入排序、基数排序、桶排序和归并排序的稳定性强于选择排序、快速排序、希尔排序和堆排序的稳定性,更具体的,冒泡排序、选择排序和插入排序的时间复杂度为O(N2),快速排序、归并排序和堆排序的时间复杂度为O(NlogN),希尔排序的时间复杂度通常认为是O(N3/2),桶排序和基数排序的时间复杂度为O(x*N)。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其实用新型构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种多个排序方法的组合流程,其特征在于:包括以下步骤:
S1、设计多个不同的排序算法包括热门、上新、购买等;
S2、构建内容库,每个内容库关联属性或分类筛选出待排序的专辑;
S3、配置组件使用的内容库,选择排序算法及每个排序算法对应的个数;
S4、对组件中的每个排序算出排序结果;
S5、对排序结果进行合并去重。
2.根据权利要求1所述的一种多个排序方法组合流程的系统,其特征在于:所述系统包括以下模块:
专辑模块,用于存放专辑的元信息,包括专辑的名称,标题,分类,属性等;
内容库模块,用于对专辑的聚合可以是基于分类、属性或者交叉;
排序模块,用于对内容进行排序;
排序组件模块,用于内容库的装载和内容库数据的计算;
排序组件展示模块,用于对结果进行聚合、过滤、组装以及输出展示。
3.根据权利要求2所述的一种多个排序方法的组合流程的系统,其特征在于:所述排序模块包含基本排序模型的设置单元,模型训练单元和排序模型生成单元。
4.根据权利要求2所述的一种多个排序方法的组合流程的系统,其特征在于:所述排序组件模块包括装载单元和计算单元,所述装载单元用于将排序模型和内容库装载进来,且计算单元用于对内容库数据进行排序。
5.根据权利要求1所述的一种多个排序方法的组合流程的系统,其特征在于:所述排序算法包括冒泡排序、选择排序、快速排序、插入排序、希尔排序、桶排序、基数排序、归并排序和堆排序。
6.根据权利要求5所述的一种多个排序方法的组合流程的系统,其特征在于:所述冒泡排序、插入排序、基数排序、桶排序和归并排序的稳定性强于选择排序、快速排序、希尔排序和堆排序的稳定性。
7.根据权利要求5所述的一种多个排序方法的组合流程的系统,其特征在于:所述冒泡排序、选择排序和插入排序的时间复杂度为O(N2),所述快速排序、归并排序和堆排序的时间复杂度为O(NlogN),所述希尔排序的时间复杂度通常认为是O(N3/2),所述桶排序和基数排序的时间复杂度为O(x*N)。
CN201910926665.8A 2019-09-27 2019-09-27 一种多个排序方法的组合流程及系统 Pending CN110765103A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910926665.8A CN110765103A (zh) 2019-09-27 2019-09-27 一种多个排序方法的组合流程及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910926665.8A CN110765103A (zh) 2019-09-27 2019-09-27 一种多个排序方法的组合流程及系统

Publications (1)

Publication Number Publication Date
CN110765103A true CN110765103A (zh) 2020-02-07

Family

ID=69330653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910926665.8A Pending CN110765103A (zh) 2019-09-27 2019-09-27 一种多个排序方法的组合流程及系统

Country Status (1)

Country Link
CN (1) CN110765103A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739417A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重音、视频专辑排序系统
CN102456016A (zh) * 2010-10-18 2012-05-16 中国移动通信集团四川有限公司 一种对搜索结果进行排序的方法及装置
CN108509622A (zh) * 2018-04-03 2018-09-07 广州阿里巴巴文学信息技术有限公司 物品排序方法、装置、计算设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739417A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重音、视频专辑排序系统
CN102456016A (zh) * 2010-10-18 2012-05-16 中国移动通信集团四川有限公司 一种对搜索结果进行排序的方法及装置
CN108509622A (zh) * 2018-04-03 2018-09-07 广州阿里巴巴文学信息技术有限公司 物品排序方法、装置、计算设备及存储介质

Similar Documents

Publication Publication Date Title
Berlingerio et al. Abacus: frequent pattern mining-based community discovery in multidimensional networks
US20130157234A1 (en) Storyline visualization
US20190129942A1 (en) Methods and systems for automatically generating reports from search results
CN102646095B (zh) 一种基于网页分类信息的对象分类方法和系统
US9305076B1 (en) Flattening a cluster hierarchy tree to filter documents
CN108369497B (zh) 在示例编程中从输入模式中进行学习
CN109918499A (zh) 一种文本分类方法、装置、计算机设备及存储介质
CN106156023A (zh) 语义匹配的方法、装置和系统
Rogers et al. What is a meme, technically speaking?
US9129216B1 (en) System, method and apparatus for computer aided association of relevant images with text
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN103514282A (zh) 一种视频搜索结果展示方法及装置
Silva et al. Integrating big data into the computing curricula
CN103366013B (zh) 一种数据处理的方法及服务器
Wang et al. TSMH Graph Cube: A novel framework for large scale multi-dimensional network analysis
CN110929160B (zh) 一种系统排序结果的优化方法
CN109672706B (zh) 一种信息推荐方法、装置、服务器及存储介质
CN108921193A (zh) 图片录入方法、服务器及计算机存储介质
CN110532528B (zh) 基于随机游走的书籍相似度计算方法及电子设备
CN110765103A (zh) 一种多个排序方法的组合流程及系统
CN101814064A (zh) 报表模板的创建方法、报表生成方法及报表系统
Raamkumar et al. A framework for scientific paper retrieval and recommender systems
CN107609110B (zh) 基于分类树的最大多样频繁模式的挖掘方法及装置
CN106156182A (zh) 将微博话题词分类到具体领域的方法和设备
CN113837216B (zh) 数据分类方法、训练方法、装置、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207