CN105302881A - 一种面向文献搜索系统的搜索提示词的生成方法 - Google Patents
一种面向文献搜索系统的搜索提示词的生成方法 Download PDFInfo
- Publication number
- CN105302881A CN105302881A CN201510662545.3A CN201510662545A CN105302881A CN 105302881 A CN105302881 A CN 105302881A CN 201510662545 A CN201510662545 A CN 201510662545A CN 105302881 A CN105302881 A CN 105302881A
- Authority
- CN
- China
- Prior art keywords
- node
- keyword
- network
- weight
- cue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向文献搜索系统的搜索提示词的生成方法。包括以下步骤:S1、用户输入关键词,文献搜索系统返回文献搜索结果,实时扑捉用户下载行为,获取其下载的文献文本。S2、将用户已下载的文献文本按照下载顺序首尾相连,组成一篇长文本,抽取其关键词和关键词之间的关系,构建关键词网络,作为该长文本的核心语义。S3、将长文本的关键词网络融合成提示词网络,实时抽取和显示提示词。S4、判断用户是否仍有下载行为,若满足跳转至S2,不满足跳转至S5。S5、结束提示词生成。将本发明方法添加到当前文献搜索系统中,能够为用户提供个性化的搜索提示词,减少搜索时间,提升用户搜索体验。
Description
技术领域
本发明涉及信息检索技术领域,特别涉及一种面向文献搜索系统的搜索提示词的生成方法。
背景技术
在大部分文献搜索引擎中,提示框中的提示词的生成方法有两种,第一是学科分类,第二是根据所有用户的搜索记录,在提示框中自动添加搜索频率最高的相关词作为提示词。属于一种协同过滤的提示词生成方法。如:国内的中国知识基础设施工程(ChinaNationalKnowledgeInfrastructure,缩写为CNKI,简称中国知网);国外的GoogleScholar,IEEEXplore,ACMDigitalLibrary等。这些搜索引擎使用的搜索提示词技术大致相同,均是按作者、文献名称、搜索热词、与原始查询词具有包含关系的词来提供搜索提示词,或者加入一些按照提示词新旧程度排序的算法,或者使用查询扩展技术,以解决检索过程中用户搜索词与检索系统词库不匹配的问题,提高信息检索的召回率和准确率。但这些技术均存在不能全面获取用户兴趣的问题,关键在于它们无法将用户个人浏览行为与认知心理学结合从而智能推理出用户兴趣,进而根据用户兴趣来提供搜索提示词,因此无法满足用户个性化需求,不具备搜索提示词应有的个性化特征。
发明内容
针对现有技术存在的缺陷,本发明的目的是提供一种面向文献搜索系统的搜索提示词的生成方法。在用户下载文献过程中抽取文献的核心语义,并融合多篇下载文献的核心语义,从中抽取用户个性化的需求提示词网络。将该方法添加到当前文献搜索系统中能够为用户提供个性化的搜索提示词,减少搜索时间,提升用户搜索体验。
为达到上述目的,本发明采用如下技术方案:
一种面向文献搜索系统的搜索提示词的生成方法,包括以下步骤:
S1、用户输入关键词,文献搜索系统返回文献搜索结果,实时扑捉用户下载行为,获取其下载的文献文本;
S2、将用户已下载的文献文本按照下载顺序首尾相连,组成一篇长文本,抽取其关键词和关键词之间的关系,构建关键词网络,作为该长文本的核心语义;
S3、将长文本的关键词网络融合成提示词网络,实时抽取和显示提示词;
S4、判断用户是否仍有下载行为,若满足跳转至S2,不满足跳转至S5;
S5、结束提示词生成。
在步骤S2中,将用户已下载的文献文本按照下载顺序首尾相连,具体方法是将文献文本的标题、摘要、关键词、正文和参考文献分别首尾相连,组成一篇长文本。
在步骤S2中,所述长文本中关键词和关键词之间的关系,是由扫描长文本全文得到的,包括以下步骤:
步骤1、抽取长文本的关键词;
步骤2、扫描全文过程中,若两个关键词出现在文献文本集合中的同一个句子中,则为这两个关键词节点建立边的关系;
步骤3、确定关键词节点的权重,若关键词i在文献文本集合中出现的次数为m,则该关键词节点的权重为
步骤4、确定关键词节点间边的权重,若两个关键词i与j在文献文本集合中共现且共现次数为n,则记i和j组成的边为eij,边eij的权重为
在步骤S3中,提示词网络是一个由7个节点组成的无向网络GWN,选择7个节点组成提示词网络的理论依据是认知心理学理论,人类的短时记忆能力是7±2个模块,因此选择中间值7从而便于用户记忆,提示词网络GWN是从用户下载文献的关键词网络KWN中抽取出的,因此提示词网络GWN的形式化定义与关键词网络KWN的形式化定义相同,即GWN={V,WV,E,WE},KWN={V,WV,E,WE},其中:
节点集合V={v1,v2…v7},KWN中的节点个数一般多于7个;GWN中的节点个数一般只包含7个节点,其中,当且仅当在当前长文本中关键词个数不足7个时,节点数选取少于7个,且选中长文本中的全部关键词对应的节点作为集合V的元素,每个节点vi表示一个最有价值的关键词;
节点的权重集合 为节点vi的权重;
节点间边的集合E={eij|i,j≤n且i≠j}每一条无向边eij表示两个节点i,j之间相连,n为节点的个数,边表示关键词以句子为单位的共现关系,即若两个关键词出现在长文本中的同一个句子中,则为这两个关键词节点建立边的关系,通过扫描长文本得到关键词的共现次数;
节点间边的权重 为边eij的权重,每一条无向边eij表示两个节点i,j之间相连,n为节点的个数。
在步骤S3中,从长文本的关键词网络中抽取提示词网络的过程是:计算关键词网络中的每个节点的价值,选出价值最高的7个节点,用这7个节点组成提示词网络,具体而言,关键词网络中的节点的价值不仅受自身权重的影响,而且也受到与之相连的节点的影响,所以使用如下公式计算关键词网络中每个节点的价值,即Value(vi):
其中vi,vj表示关键词网络中的两个节点i,j;eij表示两个节点i,j间的边;分别表示两个节点i,j的权重;表示两个节点i,j间边的权重;表示所有与节点i相连的边的权重之和;n为节点的个数;以上公式计算得出Value值最大的7个节点作为提示词呈现给用户,这7个节点不仅自身权重较高,且与之相连的节点的权重也较高,因此这7个节点能代表用户该次搜索的核心语义;根据已经得到的最有价值的7个节点与相应的边及其权重,构建提示词网络,由于提示词网络是由关键词网络抽取得到的,所以提示词网络同关键词网络有一致的结构。
与现有技术相比,本发明具有如下突出的实质性特点和显著的优点:
本发明方法在当前文献搜索系统上添加实时个性化提示词生成功能,通过扑捉用户的下载行为,获取其下载的文献文本集合,抽取文献文本集合其核心语义作为用户搜索提示词。另外,本方法中的提示词的另一个显著特色是不再以单个词语出现,而以提示词网络的形式出现;这样的好处有两点:其一,能够显示关键词之间的关系,其二,能够进行关键词的联合搜索。
附图说明
图1是本发明面向文献搜索系统的搜索提示词的生成方法流程图。
图2是实例中关键词网络融合成提示词网络的过程。
具体实施方式
下面结合附图,对本发明的具体实施例做进一步的说明。
如图1所示,一种面向文献搜索系统的搜索提示词的生成方法,包括以下步骤:
S1、用户输入关键词,文献搜索系统返回文献搜索结果,实时扑捉用户下载行为,获取其下载的文献文本;
S2、将用户已下载的文献文本按照下载顺序首尾相连,组成一篇长文本,抽取其关键词和关键词之间的关系,构建关键词网络,作为该长文本的核心语义;
S3、将长文本的关键词网络融合成提示词网络,实时抽取和显示提示词;
S4、判断用户是否仍有下载行为,若满足跳转至S2,不满足跳转至S5;
S5、结束提示词生成。
在步骤S2中,将用户已下载的文献文本按照下载顺序首尾相连,具体方法是将文献文本的标题、摘要、关键词、正文和参考文献分别首尾相连,组成一篇长文本。
在步骤S2中,所述长文本中关键词和关键词之间的关系,是由扫描长文本全文得到的,包括以下步骤:
步骤1、抽取长文本的关键词;
步骤2、扫描全文过程中,若两个关键词出现在文献文本集合中的同一个句子中,则为这两个关键词节点建立边的关系;
步骤3、确定关键词节点的权重,若关键词i在文献文本集合中出现的次数为m,则该关键词节点的权重为vi表示关键词网络中的节点i;
步骤4、确定关键词节点间边的权重,若两个关键词i与j在文献文本集合中共现且共现次数为n,则记i和j组成的边为eij,边eij的权重为
在步骤S3中,提示词网络是一个由7个节点组成的无向网络GWN,选择7个节点组成提示词网络的理论依据是认知心理学理论,人类的短时记忆能力是7±2个模块,因此选择中间值7从而便于用户记忆,提示词网络GWN是从用户下载文献的关键词网络KWN中抽取出的,因此提示词网络GWN的形式化定义与关键词网络KWN的形式化定义相同,即GWN={V,WV,E,WE},KWN={V,WV,E,WE},其中:
节点集合V={v1,v2…v7},KWN中的节点个数一般多于7个;GWN中的节点个数一般只包含7个节点,其中,当且仅当在当前长文本中关键词个数不足7个时,节点数选取少于7个,且选中长文本中的全部关键词对应的节点作为集合V的元素,每个节点vi表示一个最有价值的关键词;
节点的权重集合 为节点vi的权重;
节点间边的集合E={eij|i,j≤n且i≠j}每一条无向边eij表示两个节点i,j之间相连,n为节点的个数,边表示关键词以句子为单位的共现关系,即若两个关键词出现在长文本中的同一个句子中,则为这两个关键词节点建立边的关系,通过扫描长文本得到关键词的共现次数;
节点间边的权重 为边eij的权重,每一条无向边eij表示两个节点i,j之间相连,n为节点的个数。
在步骤S3中,从长文本的关键词网络中抽取提示词网络的过程是:计算关键词网络中的每个节点的价值,选出价值最高的7个节点,用这7个节点组成提示词网络,具体而言,关键词网络中的节点的价值不仅受自身权重的影响,而且也受到与之相连的节点的影响,所以使用如下公式计算关键词网络中每个节点的价值,即Value(vi):
其中vi,vj表示关键词网络中的两个节点i,j;eij表示两个节点i,j间的边;分别表示两个节点i,j的权重;表示两个节点i,j间边的权重;表示所有与节点i相连的边的权重之和;n为节点的个数;以上公式计算得出Value值最大的7个节点作为提示词呈现给用户,这7个节点不仅自身权重较高,且与之相连的节点的权重也较高,因此这7个节点能代表用户该次搜索的核心语义;根据已经得到的最有价值的7个节点与相应的边及其权重,构建提示词网络,由于提示词网络是由关键词网络抽取得到的,所以提示词网络同关键词网络有一致的结构。
如图2所示,将关键词网络融合成提示词网络的过程实例如下:
假设当前用户依次下载了3篇文献a、b、c。
文献a中的关键词部分为:datamining(DM),machinelearning(ML),statistics(S),bigdata(BD)。
文献b中的关键词部分为:associationrules(AR),maximumconfidence(MC),statistics(S),bigdata(BD)。
文献c中的关键词部分为:row-enumeration(RE),datamining(DM),naturallanguageprocessing(NLP)。
S1.根据最先下载的文献a的关键词,构建关键词网络KWNa。假设用矩阵的形式来表示形成的关键词网络和提示词网络,行和列分别对应关键词,矩阵中的对角线上的元素表示关键词节点的权重,矩阵的其他元素表示相应的关键词节点之间边的权重。假设在文献a中关键词DM出现3次,ML出现2次,S出现3次,BD出现4次。DM与ML在同一个句子共同出现过2次,DM与S在同一个句子共同出现过3次,DM与BD在同一个句子共同出现过3次;ML与S在同一个句子共同出现过2次,ML与BD在同一个句子共同出现过1,S与BD在同一个句子共同出现过0次。可以计算节点DM的权重为1+1/2+1/3=1.833,节点ML的权重为1+1/2=1.500,节点S的权重为1+1/2+1/3=1.833,节点BD的权重为1+1/2+1/3+1/4=2.083;节点DM与ML边的权重为1+1/2=1.500,节点DM与S的边的权重为1+1/2+1/3=1.833,节点DM与BD边的权重为1+1/2+1/3=1.833,节点ML与S的边的权重为1+1/2=1.500,节点ML与BD边的权重为1,节点S与BD之间无边。由上述计算可得关键词网络KWNa为:
S2.计算关键词网络KWNa的节点的价值,选出七个最有价值的节点生成提示词网络GWN1,并将提示词网络GWN1及时显示给用户。由公式计算各个节点的价值,得到节点DM的价值为:
接下来,在所有节点价值计算完成之后,按价值由高到低的顺序选择前七个最有价值的点作为提示词网络GWN1的节点,节点价值按从大到小的顺序排列为BD,DM,S,ML,由于KWNa中仅含有4个关键词,所以这4个节点都被选作GWN1的节点。此时显示给用户的提示词网络GWN1为:
S3.将第2篇下载的文献b的全文拼接在文献a的末尾,形成新的文献文本集合d,构建关键词网络KWNd。此时的文献d的关键词部分变为:datamining(DM),machinelearning(ML),statistics(S),bigdata(BD),associationrules(AR),maximumconfidence(MC)。根据文献d的关键词,构建关键词网络KWNd。由于关键词网络KWNd的构建与关键词网络KWNa的构建类似,这里就不再赘述。
S4.计算关键词网络KWNd的节点的价值,选出七个最有价值的节点生成提示词网络GWN2,并将提示词网络GWN2及时显示给用户。由于KWNd中仅含有6个关键词,所以这6个节点都被选作提示词网络GWN2的节点。由于提示词网络GWN2的构建方法与提示词网络GWN1的构建方法类似,这里不再赘述。
S5.将第3篇下载的文献c的全文拼接在文献d的末尾,形成新的文献文本集合e,构建关键词网络KWNe。此时的文献e的关键词部分变为:datamining(DM),machinelearning(ML),statistics(S),bigdata(BD),associationrules(AR),maximumconfidence(MC),row-enumeration(RE),naturallanguageprocessing(NLP)。根据文献e的关键词,统计各个关键词在文献文本集合e中出现的次数,以及各个关键词在文献文本集合e中同一个句子中共同出现的次数,并由这些数据构建关键词网络KWNe。由于关键词网络KWNe的构建与关键词网络KWNa的构建类似,这里就不再赘述。
S6.计算关键词网络KWNe的节点的价值,选出七个最有价值的节点生成提示词网络GWN3,并将提示词网络GWN3及时显示给用户。由于KWNd中含有8个(大于7个)关键词,所以这8个节点不能都被选作提示词网络GWN3的节点,按照步骤S2中的方法,同理计算出这8个关键词节点的价值,选出其中7个价值最大的节点作为提示词网络GWN3的节点,舍去价值最小的节点,即不在提示词网络GWN3中进行显示。
综上所述,根据本发明较佳实施例提供的一种面向文献搜索系统的搜索提示词的生成方法,在一次搜索中,分析该次用户下载的文献,得出用户该次搜索的核心语义。也即,在用户实时浏览时,通过扑捉用户的下载行为来扑捉用户的短时兴趣。最后,通过提示词网络的显示,辅助用户更快更准确地找到自己想要的文献。
Claims (5)
1.一种面向文献搜索系统的搜索提示词的生成方法,其特征在于,包括以下步骤:
S1、用户输入关键词,文献搜索系统返回文献搜索结果,实时扑捉用户下载行为,获取其下载的文献文本;
S2、将用户已下载的文献文本按照下载顺序首尾相连,组成一篇长文本,抽取其关键词和关键词之间的关系,构建关键词网络,作为该长文本的核心语义;
S3、将长文本的关键词网络融合成提示词网络,实时抽取和显示提示词;
S4、判断用户是否仍有下载行为,若满足跳转至S2,不满足跳转至S5;
S5、结束提示词生成。
2.根据权利要求1所述的面向文献搜索系统的搜索提示词的生成方法,其特征在于,在步骤S2中,将用户已下载的文献文本按照下载顺序首尾相连,具体方法是将文献文本的标题、摘要、关键词、正文和参考文献分别首尾相连,组成一篇长文本。
3.根据权利要求1所述的面向文献搜索系统的搜索提示词的生成方法,其特征在于,在步骤S2中,所述长文本中关键词和关键词之间的关系,是由扫描长文本全文得到的,包括以下步骤:
步骤1、抽取长文本的关键词;
步骤2、扫描全文过程中,若两个关键词出现在文献文本集合中的同一个句子中,则为这两个关键词节点建立边的关系;
步骤3、确定关键词节点的权重,若关键词i在文献文本集合中出现的次数为m,则该关键词节点的权重为
步骤4、确定关键词节点间边的权重,若两个关键词i与j在文献文本集合中共现且共现次数为n,则记i和j组成的边为eij,边eij的权重为
4.根据权利要求1所述的面向文献搜索系统的搜索提示词的生成方法,其特征在于,在步骤S3中,提示词网络是一个由7个节点组成的无向网络GWN,选择7个节点组成提示词网络的理论依据是认知心理学理论,人类的短时记忆能力是7±2个模块,因此选择中间值7从而便于用户记忆,提示词网络GWN是从用户下载文献的关键词网络KWN中抽取出的,因此提示词网络GWN的形式化定义与关键词网络KWN的形式化定义相同,即GWN={V,WV,E,WE},KWN={V,WV,E,WE},其中:
节点集合V={v1,v2…v7},KWN中的节点个数一般多于7个;GWN中的节点个数一般只包含7个节点,其中,当且仅当在当前长文本中关键词个数不足7个时,节点数选取少于7个,且选中长文本中的全部关键词对应的节点作为集合V的元素,每个节点vi表示一个最有价值的关键词;
节点的权重集合 为节点vi的权重;
节点间边的集合E={eij|i,j≤n且i≠j}每一条无向边eij表示两个节点i,j之间相连,n为节点的个数,边表示关键词以句子为单位的共现关系,即若两个关键词出现在长文本中的同一个句子中,则为这两个关键词节点建立边的关系,通过扫描长文本得到关键词的共现次数;
节点间边的权重 为边eij的权重,每一条无向边eij表示两个节点i,j之间相连,n为节点的个数。
5.根据权利要求1所述的面向文献搜索系统的搜索提示词的生成方法,其特征在于,在步骤S3中,从长文本的关键词网络中抽取提示词网络的过程是:计算关键词网络中的每个节点的价值,选出价值最高的7个节点,用这7个节点组成提示词网络,具体而言,关键词网络中的节点的价值不仅受自身权重的影响,而且也受到与之相连的节点的影响,所以使用如下公式计算关键词网络中每个节点的价值,即Value(vi):
其中vi,vj表示关键词网络中的两个节点i,j;eij表示两个节点i,j间的边;分别表示两个节点i,j的权重;表示两个节点i,j间边的权重;表示所有与节点i相连的边的权重之和;n为节点的个数;以上公式计算得出Value值最大的7个节点作为提示词呈现给用户,这7个节点不仅自身权重较高,且与之相连的节点的权重也较高,因此这7个节点能代表用户该次搜索的核心语义;根据已经得到的最有价值的7个节点与相应的边及其权重,构建提示词网络,由于提示词网络是由关键词网络抽取得到的,所以提示词网络同关键词网络有一致的结构。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510662545.3A CN105302881A (zh) | 2015-10-14 | 2015-10-14 | 一种面向文献搜索系统的搜索提示词的生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510662545.3A CN105302881A (zh) | 2015-10-14 | 2015-10-14 | 一种面向文献搜索系统的搜索提示词的生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105302881A true CN105302881A (zh) | 2016-02-03 |
Family
ID=55200151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510662545.3A Pending CN105302881A (zh) | 2015-10-14 | 2015-10-14 | 一种面向文献搜索系统的搜索提示词的生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105302881A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019057191A1 (zh) * | 2017-09-25 | 2019-03-28 | 腾讯科技(深圳)有限公司 | 内容检索方法、终端、服务器、电子设备及存储介质 |
CN109635081A (zh) * | 2018-11-23 | 2019-04-16 | 上海大学 | 一种基于词频幂律分布特性的文本关键词权重计算方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186615A (zh) * | 2011-12-30 | 2013-07-03 | 北大方正集团有限公司 | 一种搜索提示方法及系统 |
US20140188867A1 (en) * | 2004-08-31 | 2014-07-03 | Semantic Search Technologies Llc | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
CN104090881A (zh) * | 2013-10-25 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种显示搜索提示词的方法、终端及服务器 |
CN104331434A (zh) * | 2014-10-22 | 2015-02-04 | 乐视网信息技术(北京)股份有限公司 | 一种生成搜索提示词服务的方法及其装置 |
-
2015
- 2015-10-14 CN CN201510662545.3A patent/CN105302881A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140188867A1 (en) * | 2004-08-31 | 2014-07-03 | Semantic Search Technologies Llc | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
US8880497B1 (en) * | 2004-08-31 | 2014-11-04 | Samantic Search Technologies LLC | Computer-aided extraction of semantics from keywords to confirm match of buyer offers to seller bids |
CN103186615A (zh) * | 2011-12-30 | 2013-07-03 | 北大方正集团有限公司 | 一种搜索提示方法及系统 |
CN104090881A (zh) * | 2013-10-25 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 一种显示搜索提示词的方法、终端及服务器 |
CN104331434A (zh) * | 2014-10-22 | 2015-02-04 | 乐视网信息技术(北京)股份有限公司 | 一种生成搜索提示词服务的方法及其装置 |
Non-Patent Citations (1)
Title |
---|
高英虎: "面向学术搜索系统的用户需求发现模型", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019057191A1 (zh) * | 2017-09-25 | 2019-03-28 | 腾讯科技(深圳)有限公司 | 内容检索方法、终端、服务器、电子设备及存储介质 |
CN109948073A (zh) * | 2017-09-25 | 2019-06-28 | 腾讯科技(深圳)有限公司 | 内容检索方法、终端、服务器、电子设备及存储介质 |
CN109635081A (zh) * | 2018-11-23 | 2019-04-16 | 上海大学 | 一种基于词频幂律分布特性的文本关键词权重计算方法 |
CN109635081B (zh) * | 2018-11-23 | 2023-06-13 | 上海大学 | 一种基于词频幂律分布特性的文本关键词权重计算方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105488024B (zh) | 网页主题句的抽取方法及装置 | |
CN104537116B (zh) | 一种基于标签的图书搜索方法 | |
CN103729359B (zh) | 一种推荐搜索词的方法及系统 | |
CN104899273B (zh) | 一种基于话题和相对熵的网页个性化推荐方法 | |
CN105468605B (zh) | 一种实体信息图谱生成方法及装置 | |
CN104008106B (zh) | 一种获取热点话题的方法及装置 | |
CN104866593A (zh) | 一种基于知识图谱的数据库搜索方法 | |
CN104021198B (zh) | 基于本体语义索引的关系数据库信息检索方法及装置 | |
CN103838837B (zh) | 基于语义模板的遥感元数据集成方法 | |
CN107562831A (zh) | 一种基于全文检索的精确查找方法 | |
CN102411621A (zh) | 一种基于云模型的中文面向查询的多文档自动文摘方法 | |
CN106446162A (zh) | 一种面向领域的本体知识库文本检索方法 | |
CN104268230B (zh) | 一种基于异质图随机游走的中文微博客观点探测方法 | |
CN110083683B (zh) | 基于随机游走的实体语义标注方法 | |
US20120310963A1 (en) | Apparatus and method of searching and visualizing instance path | |
CN107729481B (zh) | 一种自定义规则的文本信息抽取结果筛选方法及装置 | |
CN103123650A (zh) | 一种基于整数映射的xml数据库全文索引方法 | |
CN107239512A (zh) | 一种结合评论关系网络图的微博垃圾评论识别方法 | |
CN106708929A (zh) | 视频节目的搜索方法和装置 | |
CN105718585A (zh) | 文档与标签词语义关联方法及其装置 | |
CN104102658A (zh) | 文本内容挖掘方法及装置 | |
CN103150409B (zh) | 一种用户检索词推荐的方法及系统 | |
Chantrapornchai et al. | Information extraction based on named entity for tourism corpus | |
CN103838792A (zh) | 一种网页主题确定的方法 | |
CN102254025B (zh) | 信息回忆检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160203 |
|
RJ01 | Rejection of invention patent application after publication |