CN103778169B - 信息排序方法 - Google Patents

信息排序方法 Download PDF

Info

Publication number
CN103778169B
CN103778169B CN201210417662.XA CN201210417662A CN103778169B CN 103778169 B CN103778169 B CN 103778169B CN 201210417662 A CN201210417662 A CN 201210417662A CN 103778169 B CN103778169 B CN 103778169B
Authority
CN
China
Prior art keywords
information
weights
user
constant
less
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210417662.XA
Other languages
English (en)
Other versions
CN103778169A (zh
Inventor
占晓炜
王栋
廖智海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Snowball (Beijing) Technology Development Co., Ltd.
Original Assignee
BEIJING XUEQIU INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING XUEQIU INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING XUEQIU INFORMATION TECHNOLOGY Co Ltd
Priority to CN201210417662.XA priority Critical patent/CN103778169B/zh
Publication of CN103778169A publication Critical patent/CN103778169A/zh
Application granted granted Critical
Publication of CN103778169B publication Critical patent/CN103778169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出两种信息排序方法,其中一种方法包括:确定信息的匹配词;针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;其中,lengthNorm为信息的权值;numTerms为匹配词出现的次数;TERM_VERTEX_NUM为预先设置的极值点,L1、L2、L3、L4和L5均为常数;根据各条信息的权值对信息进行排序。本发明能够快速客观地实现信息排序。

Description

信息排序方法
技术领域
本发明涉及计算机互联网技术领域,尤其涉及信息排序方法。
背景技术
互联网用户在搜索网络论坛中的信息时,对于符合搜索条件的多个信息,通常优先读取排序在前的信息。现有的论坛信息排序方式一般有两种:第一种,按照信息产生的先后顺序进行排序,即产生时间越晚的信息排序越靠前,这种方式无法体现信息的重要性。第二种,通过人工的方式筛选出认为流行性和热度高的信息,但是一旦选定后信息的排序就固定下来,直到下次人工筛选之后再进行更改,这样用户在一段时间内重复获取信息时将会获得重复的信息,并请如果信息数量非常大,人工筛选的工作量将会很大。
可见,现有的网络论坛信息的排序方法无法快速客观地实现信息排序。
发明内容
本发明提供了两种信息排序方法,能够快速客观地实现信息排序。
本发明的技术方案是这样实现的:
一种信息排序方法,包括:
确定信息的匹配词;
针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;
其中,
lengthNorm为信息的权值;
numTerms为匹配词出现的次数;
TERM_VERTEX_NUM为预先设置的极值点;
L1为大于0小于10的常数,L2为大于0小于1的常数,L3为大于1小于10的常数,L4为大于0小于100的常数,L5为大于0小于1的常数;
根据各条信息的权值对信息进行排序。
上述方法中,所述信息可以为交易评论信息,上述方法可以进一步包括:
获取包含用户要求查看时段的信息;
显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。
一种信息排序方法,包括:
针对需要排序的每条信息,采用下式计算该信息的热度权值;
其中,
xRank为信息的热度权值;
_INNER_SCORE为Lucene相似度评分,Lucene相似度评分是以向量空间模型算法来计算的评分;
A为用户投票数,其中,A=R×X1+C×X2+F×X3,R为该信息被用户转推的次数,C为该信息被用户评论的次数,F为该信息被用户收藏的次数,X1、X2和X3均为大于0小于10的常数;
Pt为该信息发表时刻距离标准时刻的时间长度;
S1为大于1小于86400×n的常数,n为自然数;
根据各条信息的热度权值对信息进行排序。
上述方法中,所述信息可以为交易评论信息,上述方法可以进一步包括:
获取包含用户要求查看时段的信息;
显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的热度权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的热度权值。
可见,本发明提出的两种信息排序方法,通过预先设置的权值计算方法计算信息的权值,可以实现快速客观地对信息进行排序。
附图说明
图1为本发明提出的第一种信息排序方法流程图;
图2为本发明提出的第二种信息排序方法流程图。
具体实施方式
本发明提出两种信息排序方法,能够对网络论坛信息进行排序;对于交易评论信息,还可以将信息映射到交易行情图中。
如图1为本发明提出的第一种信息排序方法流程图,包括:
步骤101:确定信息的匹配词。
步骤102:针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;
其中,
lengthNorm为信息的权值;
numTerms为匹配词出现的次数;
TERM_VERTEX_NUM为预先设置的极值点,表示这个长度的信息的评分权值最高,同时匹配词出现的次数越多权值越高;
L1、L2、L3、L4和L5均为常数,是为了使倒抛物线函数所表示的图形更为平滑或者更为陡峭,来确定所计算的内容之间得分的差距的大小。L1、L2、L3、L4和L5的范围分别为:L1(0-10),L2(0-1),L3(1-10),L4(0-100),L5(0-1)。
可见,上述权值算法是一个倒抛物线型函数。
步骤103:根据各条信息的权值对信息进行排序。
以上信息可以是交易(如股票交易)评论信息,本发明可以将交易评论信息映射到交易行情图上进行显示,同时显示该交易评论信息的权值。
具体方式为:
获取包含用户要求查看时段的信息;
显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。
需要说明的是,一般的交易行情图只显示交易时段的数据,在本发明中,由于需要显示用户的交易评论信息,而用户产生的交易评论信息不止在交易时段才有,故本发明加入了非交易时段的显示。从显示上,交易时段的行情图用实线表示,非交易时段的行情图用虚线表示,以使二者明确区分;从实现上,将一天分为三个时段:开市前、开市中、闭市后,可以将这三个时段采用1:1:1的比例在图形上进行显示,以减少非交易时段图形对交易时段过多的影响。
如图2为本发明提出的第二种信息排序方法流程图,包括:
步骤201:针对需要排序的每条信息,采用下式计算该信息的热度权值;
其中,
xRank为信息的热度权值;
_INNER_SCORE为Lucene相似度评分,Lucene相似度评分是以向量空间模型算法来计算的评分;
A为用户投票数,其中,A=R×X1+C×X2+F×X3,R为该信息被用户转推的次数,C为该信息被用户评论的次数,F为该信息被用户收藏的次数,X1、X2和X3均为大于0小于10的常数;
Pt为该信息发表时刻距离标准时刻的时间长度;具体可以为:Pt=PublishTime-St,其中,PublishTime为信息发表时刻,St=T1,T1为第一条信息发表的时刻;
S1为大于1小于86400×n的常数,n为自然数;是用于确定信息随时间衰减的程度,S1越小衰减的越快,S1越大衰减的越慢。86400为一天的秒数,也就是说这个值可以是任意秒/分钟/小时/天。
上式中,用户投票的函数log(A),用户投票越多,该信息得分越多,但增速逐渐减缓;时间函数新发表的信息得分高于以往的信息,分母S1为以秒为单位的常数。
步骤202:根据各条信息的热度权值对信息进行排序。
以上信息可以是交易(如股票交易)评论信息,本发明可以将交易评论信息映射到交易行情图上进行显示,同时显示该交易评论信息的热度权值。具体方式与方法一中的显示方式相同。
综上可见,本发明提出的信息排序方法,能够通过预先设定的算法对自动计算信息的权重,从而快速客观地实现信息排序,避免了人工筛选处理信息数量非常多时无法及时准确处理的问题。进一步地,从展示信息的角度,本发明可以将筛选出的信息与交易行情图中的相应时间点进行匹配并显示权重,这样可以直观地在行情涨跌过程中展示用户进行的集中的热门讨论,易于观察回溯历史上任何时段中用户随着行情波动进行的讨论。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (4)

1.一种信息排序方法,其特征在于,所述方法包括:
确定信息的匹配词;
针对需要排序的每条信息,统计信息中匹配词出现的次数,采用下式计算该信息的权值;
lengthNorm = L 1 [ L 2 × ( numTerms - TERM _ VERTEX _ NUM ) L 3 + L 4 ] L 5 ; 其中,
lengthNorm为信息的权值;
numTerms为匹配词出现的次数;
TERM_VERTEX_NUM为预先设置的极值点;
L1为大于0小于10的常数,L2为大于0小于1的常数,L3为大于1小于10的常数,L4为大于0小于100的常数,L5为大于0小于1的常数;
根据各条信息的权值对信息进行排序。
2.根据权利要求1所述的方法,其特征在于,所述信息为交易评论信息,所述方法进一步包括:
获取包含用户要求查看时段的信息;
显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的权值。
3.一种信息排序方法,其特征在于,所述方法包括:
针对需要排序的每条信息,采用下式计算该信息的热度权值;
xRank = _ INNER _ SCORE × log ( A ) + Pt S 1 ; 其中,
xRank为信息的热度权值;
_INNER_SCORE为Lucene相似度评分,Lucene相似度评分是以向量空间模型算法来计算的评分;
A为用户投票数,其中,A=R×X1+C×X2+F×X3,R为该信息被用户转推的次数,C为该信息被用户评论的次数,F为该信息被用户收藏的次数,X1、X2和X3为大于0小于10的常数;
Pt为该信息发表时刻距离标准时刻的时间长度;
S1为大于1小于86400×n的常数,n为自然数;
根据各条信息的热度权值对信息进行排序。
4.根据权利要求3所述的方法,其特征在于,所述信息为交易评论信息,所述方法进一步包括:
获取包含用户要求查看时段的信息;
显示所述用户要求查看时段的交易行情图,查找所述用户要求查看时段的交易评论信息,获取所述交易评论信息的热度权值,将所述交易评论信息映射到所述交易行情图中,并在交易行情图中显示所述交易评论信息的热度权值。
CN201210417662.XA 2012-10-26 2012-10-26 信息排序方法 Active CN103778169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210417662.XA CN103778169B (zh) 2012-10-26 2012-10-26 信息排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210417662.XA CN103778169B (zh) 2012-10-26 2012-10-26 信息排序方法

Publications (2)

Publication Number Publication Date
CN103778169A CN103778169A (zh) 2014-05-07
CN103778169B true CN103778169B (zh) 2017-02-08

Family

ID=50570411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210417662.XA Active CN103778169B (zh) 2012-10-26 2012-10-26 信息排序方法

Country Status (1)

Country Link
CN (1) CN103778169B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537059B (zh) * 2014-12-27 2018-06-19 小米科技有限责任公司 对象排名方法及装置
CN105335495A (zh) * 2015-10-22 2016-02-17 上海新储集成电路有限公司 一种通过统计频率的搜索匹配方法及系统
CN105741177A (zh) * 2016-01-29 2016-07-06 中国联合网络通信集团有限公司 即时通信平台社交信息显示方法及显示装置
CN109947840B (zh) * 2017-09-25 2021-05-14 北京国双科技有限公司 告警数据展示方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7289982B2 (en) * 2001-12-13 2007-10-30 Sony Corporation System and method for classifying and searching existing document information to identify related information
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN101494675A (zh) * 2008-12-23 2009-07-29 上海闻泰电子科技有限公司 一种移动通讯终端中通信录排序的方法
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7289982B2 (en) * 2001-12-13 2007-10-30 Sony Corporation System and method for classifying and searching existing document information to identify related information
CN101436186A (zh) * 2007-11-12 2009-05-20 北京搜狗科技发展有限公司 一种提供相关搜索的方法及系统
CN101494675A (zh) * 2008-12-23 2009-07-29 上海闻泰电子科技有限公司 一种移动通讯终端中通信录排序的方法
CN102411754A (zh) * 2011-11-29 2012-04-11 南京大学 一种基于商品属性熵值的个性化推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"一种改进的专题搜索结果排序算法的研究";林雪楠;《中国优秀硕士学位论文全文数据库信息科技辑》;20090315(第03期);第40页 *

Also Published As

Publication number Publication date
CN103778169A (zh) 2014-05-07

Similar Documents

Publication Publication Date Title
CN103365902B (zh) 互联网新闻的评估方法和装置
CN102262663B (zh) 一种软件缺陷报告修复方法
CN103778169B (zh) 信息排序方法
CN101661483B (zh) 一种推荐系统及推荐方法
CN104166731A (zh) 一种社交网络重叠社区发现系统及其方法
CN106250438A (zh) 基于随机游走模型的零引用文章推荐方法及系统
CN110109922A (zh) 绩效数据获取方法、装置、计算机设备及存储介质
CN106127634A (zh) 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
He et al. Enhancing the future impact of Six Sigma management
CN105069647A (zh) 一种改进的抽取中文商品评论中评价对象的方法
CN106294727A (zh) 一种推荐信息的方法及设备
CN103353865A (zh) 一种基于位置的易货电子交易商品推荐方法
CN105740434A (zh) 网络信息评分方法及装置
CN106651582A (zh) 基于指令流毒性指标的证券交易风险预警方法及系统
CN104572915A (zh) 一种基于内容环境增强的用户事件相关度计算方法
CN107122898A (zh) 一种基于数据统计的贸易端到端SaaS风控方法
CN110222010A (zh) 基于区块链的论文保存方法、设备及计算机可读存储介质
CN103678720B (zh) 用户反馈数据处理方法和装置
CN110428286A (zh) 一种基于消费市场大数据资源的动态定价系统及方法
CN110443646A (zh) 产品竞争关系网络分析方法和系统
Orlik Reform at China's National Bureau of Statistics under Ma Jiantang 2008–2013
CN114139848A (zh) 城市数据资产评估方法
CN103020081A (zh) 站外投放关键词方法和系统
CN109213937A (zh) 智能搜索方法及装置
Hayrapetyan et al. A DECISION SUPPORT SYSTEM FOR COLLEGE MAJOR SELECTION.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20181211

Address after: 100102 19th Floor, 3A Block, Soho Tower, Wangjing, No. 1 Courtyard, Futong East Street, Chaoyang District, Beijing

Patentee after: Snowball (Beijing) Technology Development Co., Ltd.

Address before: 100080 Beijing Haidian District Haidian North Second Street No. 8 803

Patentee before: BEIJING XUEQIU INFORMATION TECHNOLOGY CO., LTD.

TR01 Transfer of patent right