CN108897843A

CN108897843A - 一种基于中心法的文本自适应推荐方法

Info

Publication number: CN108897843A
Application number: CN201810680522.9A
Authority: CN
Inventors: 尹积栋; 彭崧; 汪文俊; 谢茶花; 邬慰娟; 刘红; 曾昭虎; 肖小春
Original assignee: Jian College
Current assignee: Jian College
Priority date: 2018-06-27
Filing date: 2018-06-27
Publication date: 2018-11-27
Anticipated expiration: 2038-06-27
Also published as: CN108897843B

Abstract

本发明提出了一种基于中心法的文本自适应推荐方法，以中心法检索为基础，对文本进行高频词自适归集和再次检索，归集后的高频词进行精准性推荐和相关性推荐。解决了现有技术中检索反馈信号过度集中或针对性差的技术问题。

Description

一种基于中心法的文本自适应推荐方法

技术领域

本发明涉及基于关键词的自适应推荐方法，特别是指一种基于中心法的文本自适应推荐方法。

背景技术

在文本阅读中，根据需求词汇进行检索是一种常见的检索方式。然而检索实际是对信息理解或知晓不足而导致的信息需求，基于信息量的不足的情况下，需要对基于本信息的内容进行随大流地知晓相同的声音，了解信息市场及周边信息的响应情况；又或者我们对信息需求知之而又需要了解到一些不清楚又要对信息量进行深挖的技术。

有鉴于些，提供一种适于人们检索习性，而又能精确挖掘检索信息和分散覆盖周边信息的文本检索方式成为必要。

发明内容

本发明提出一种基于中心法的文本自适应推荐方法，解决了现有技术中检索反馈信号过度集中或针对性差的技术问题。

本发明的技术方案是这样实现的：一种基于中心法的文本自适应推荐方法，本以中心法检索为基础，对文本进行高频词自适归集和再次检索，归集后的高频词进行精准性推荐和相关性推荐。

将获取到的关键词进行首次检索，从首次检索得到文件中随机抽取N项文本，将N项文本进行文本类比得到第一类比高频词。

将第一类比出高频词与关键词组合进行第二次检索，从检索得到文件中随机抽取N项文本类比出第二次高频词，

第二高频词与关键词组合进行检索类比出第三高频词，

第一高频词、第二高频词、第三高频词同时进行检索得到高频检索文本，从高频文本中进行二次关键词检索，将检索得到文本进行推荐，将高频文本中不含关键词的文本进行相关性推荐。

文本类比为将文本内容进行使用次数加权，其中加权方式包括单文本加权和多文本加权。

单文本加权有多个文本视为高频词时,将其定义为高频词。

单文本加权有多文本多词为高频词时，结合多文本加权定义高频词。

当文本检索量少于预定义N值时，进行多文本加权定义高频词。

多文本加权为将单文本中高频词的权重相叠加，最高权重词定义为高频词。

根据权利要求1所述的推荐方法，其特征在于：

当高频词有重合或不足时，第二次获取高频词。

类比出的高频词为一项及其以上。

与现有技术相比，本发明提供的一种基于中心法的文本自适应推荐方法，以中心法检索为基础，对文本进行高频词自适归集和再次检索，归集后的高频词进行精准性推荐和相关性推荐。

具体实施方式

下面将结合本发明实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的一种基于中心法的文本自适应推荐方法，本以中心法检索为基础，对文本进行高频词自适归集和再次检索，归集后的高频词进行精准性推荐和相关性推荐。

第二高频词与关键词组合进行检索类比出第三高频词，

单文本加权有多个文本视为高频词时,将其定义为高频词。

根据权利要求1所述的推荐方法，其特征在于：

当高频词有重合或不足时，第二次获取高频词。

类比出的高频词为一项及其以上。

将首次检索文本及第二次检索文本进行第二次类比，类比出第二高频词，当取非第一高频词为第三次检索，将第一次检索文本、第二次检索文本和第三次检索文本分别随机Z项推荐至前端。多高频词使用频率较为相近时，进行单文本加权，

首次检索、第二次检索和第三次检索及高频检索基于中心法计算检索。

相关性推荐以随机性抽选方式推荐。

具有多词在多文本中为高频词时，以多文本加权确定多文本高频词

对文本进行常规检索，并对检索信息进行分析，对文本中高频词即高权次词随机抽取方法进行抽取。对任一文本中内容进行拆解和归权，剔除习惯用词和单一文本中出现的高频词。经过多次训练高频词，使得高频词更有广度和深度，从而推荐的信息具有密切性。多次训练的深挖掘词，进行检索，使得信息不局限于当前关键词。从相关性文本中进行关键词的检索，使得文本具有相关领域内的广泛性和具化性，易于找到想到的文本，同时通过非关键词文本进行推荐，可为检索带来未知识思维或文本体系内容，二者相相辅相成，具有重要意义。

文本类比为将文本内容进行使用次数加权，其中加权方式包括单文本加权和多文本加权。加权即为常见词进行权重化，尤其为名词权重进行起始值权利量优化或叠加权重质的基数阶梯化，使得检索结果的有效性更优化。

单文本加权有多个文本视为高频词时,将其定义为高频词。单文本加权有多文本多词为高频词时，结合多文本加权定义高频词。当文本检索量少于预定义N值时，进行多文本加权定义高频词。多文本加权为将单文本中高频词的权重相叠加，最高权重词定义为高频词。当高频词有重合或不足时，第二次获取高频词。类比出的高频词为一项及其以上。对文本加权进行具象化。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于中心法的文本自适应推荐方法，所述推荐方法基于存储设备，其特征在于：

将获取到的关键词进行自动首次检索，从首次检索得到文件中随机抽取N项文本，将N项文本进行文本类比得到第一类比高频词；

将第一类比出高频词与关键词组合进行第二次检索，从检索得到文件中随机抽取N项文本类比出第二类比高频词；

将第二类比出高频词与关键词组合进行第三次检索，从检索得到文件中随机抽取N项文本类比出第三类比高频词；

第一类比高频词、第二类比高频词、第三类比高频词同时进行检索得到高频检索文本，从高频文本中进行二次关键词检索，将检索得到文本进行推荐，将高频文本中不含关键词的文本进行相关性推荐。

2.根据权利要求1所述的一种基于中心法的文本自适应推荐方法，其特征在于：

3.根据权利要求2所述的一种基于中心法的文本自适应推荐方法，其特征在于：

单文本加权有多个文本视为高频词时,将其定义为高频词。

4.根据权利要求2所述的一种基于中心法的文本自适应推荐方法，其特征在于：

5.根据权利要求2所述的一种基于中心法的文本自适应推荐方法，其特征在于：

6.根据权利要求4或5所述的一种基于中心法的文本自适应推荐方法，其特征在于：

7.根据权利要求1所述的一种基于中心法的文本自适应推荐方法，其特征在于：

当高频词有重合或不足时，第二次获取高频词。

8.根据权利要求1所述的一种基于中心法的文本自适应推荐方法，其特征在于：

类比出的高频词为一项及其以上。