CN107590235A - 一种信息关联搜索推荐方法 - Google Patents
一种信息关联搜索推荐方法 Download PDFInfo
- Publication number
- CN107590235A CN107590235A CN201710804114.5A CN201710804114A CN107590235A CN 107590235 A CN107590235 A CN 107590235A CN 201710804114 A CN201710804114 A CN 201710804114A CN 107590235 A CN107590235 A CN 107590235A
- Authority
- CN
- China
- Prior art keywords
- focus
- user
- information
- clue
- recommendation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种信息关联搜索推荐方法,本申请旨在解决现有技术无法对用户关注点进行深入挖掘而导致对用户需求无法拓展的问题,本发明引入通过对用户关注点进行纵向与横向的挖掘,纵向采用分级处理模式,对用户的关注点进行深度全面挖掘,为用户提供更有价值的搜索信息,同时给用户提供了以关注点为中心的更有逻辑性的信息,同时进行横向关联,使得用户不局限于一个故事逻辑,获得更加全面的信息;本申请适用于信息关联管理及推荐相关领域。
Description
技术领域
本发明涉及信息关联管理及推荐,具体来说,涉及一种信息关联搜索推荐方法。
背景技术
面对爆发式增长的互联网信息,人们能够准确、完整地获取所需信息的成本日益增加。一些新闻聚合平台开始计算法来实现给用户展现的内容能够无限接近其阅读偏好,即所谓的个性化推荐。用户想看什么,它们就给什么!
而从目前的实现来看还存在一些缺陷:(1)通过独立的标签以及权重为用户的喜好画像的方式不具备扩散性,即用户的喜好总是局限在有限的关注点,而没有将点与点以某种组织关系连接起来,也没有点的上伸和下延;(2)对于用户搜索行为的挖掘不够,仅仅是搜什么给什么,即使是有关联推荐也都属于和关注点所属的关注点同级,而没有对关注点进行上下级扩展,不利于用户对信息的宏观认知。
发明内容
本发明的目的在于:针对上述现有技术无法对用户关注点进行深入挖掘而导致对用户需求无法拓展的问题,本发明提供一种信息关联搜索推荐方法。
本发明采用的技术方案如下:
本申请提供了一种信息关联搜索推荐方法,包括以下步骤:
步骤1:根据关注点数据库建立关注点纵向线索,根据关注点数据库的同级词建立关注点横向线索;
步骤2:输入用户关注点;
步骤3:根据步骤2中的用户关注点及步骤1中关注点纵向线索在用户关注点上一级关注点和下一级关注点之间建立一条纵向词树,同时根据步骤1中的关注点横向线索搜索出用户关注点的同级关联关注点,筛选出符合设定的纵向词树和符合设定的同级关联关注点的相关信息推送至用户。
具体地,所述步骤1中根据关注点的领域信息建立关注点纵向线索具体步骤为:
根据关注点数据库划分N个基础领域,根据基础领域再划分子领域,根据子领域再划分若干个关注点,关注点下再划分子关注点,形成具有层级关系的关注点数据库。
具体地,所述步骤3中根据步骤2中的用户关注点及步骤1种关注点纵向线索在用户关注点上一级关注点和下一级关注点之间建立一条纵向词树的具体步骤为:
根据用户关注点判断其上一级关注点和下一级关注点;
抓取包含用户关注点及其上一级关注点和下一级关注点之间所有纵向词树;
显示纵向词树的用户关注点及其上一级关注点和下一级关注点的相关信息。
具体地,所述基础领域由人工设定,基础领域再划分子领域原则包括包含原则、因果原则、利害原则和时间原则。
不同的子领域有不同的权值,比如“疾病”类的更关注“利害”关系,“娱乐”类的更关注时间原则。
具体地,还包括步骤4:根据步骤3用户的收索浏览结果更新关注点数据库以及对应的关注点纵向线索和关注点横向线索。
其中应当说明的是:
将建立横、纵向的关联关系(是人工建立的),并按照事务的发展规律以及当前所处于的时间阶段,做时间上的关联衍生。例如:“糖尿病检查”和“胰岛素注射技巧”,虽然都是属于“疾病”,但一个是早期未确诊治疗,一个是已经得病并在治疗中,处于不同的事务发展阶段,也会有不同的方向进行结果输出。
最小关注点也指最小子领域,能够识别的最详细的领域。
用户关注点的上一级关注点和下一级关注点即:用户关注点的父关注点和子关注点。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.本发明引入通过对用户关注点进行纵向与横向的挖掘,纵向采用分级处理模式,对用户的关注点进行深度全面挖掘,为用户提供更有价值的搜索信息,同时给用户提供了以关注点为中心的更有逻辑性的信息,同时进行横向关联,使得用户不局限于一个故事逻辑,获得更加全面的信息;
2.本发明通过引入纵向深入挖掘,不再像传统局限于有限的关注点,使得数据挖掘的关注点更加广泛;
3.本申请在给用户推送搜索结果时候,省略了中间层级关注点,解决了现有的搜索方式需要深度遍历每个节点,导致系统负担过重,挖掘速度慢的难点;
4.采集用户的搜索结果,并对关注点数据库进行更新,优化整个搜索词库,便于下一次的搜索。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1是本发明的整体结构图;
图2是本发明注点纵向线索的示意图;
图3是本发明注点横向线索的示意图;
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图3对本发明作详细说明。
一种信息关联搜索推荐方法,包括以下步骤:
步骤1:根据关注点数据库建立关注点纵向线索,根据关注点数据库的同级词建立关注点横向线索;
步骤2:输入用户关注点;
步骤3:根据步骤2中的用户关注点及步骤1中关注点纵向线索在用户关注点上一级关注点和下一级关注点之间建立一条纵向词树,同时根据步骤1中的关注点横向线索搜索出用户关注点的同级关联关注点,筛选出符合设定的纵向词树和符合设定的同级关联关注点的相关信息推送至用户。
具体地,所述步骤1中根据关注点的领域信息建立关注点纵向线索具体步骤为:
根据关注点数据库划分N个基础领域,根据基础领域再划分子领域,根据子领域再划分若干个关注点,关注点下再划分子关注点,形成具有层级关系的关注点数据库。
具体地,所述步骤3中根据步骤2中的用户关注点及步骤1种关注点纵向线索在用户关注点上一级关注点和下一级关注点之间建立一条纵向词树的具体步骤为:
根据用户关注点判断其上一级关注点和下一级关注点;
抓取包含用户关注点及其上一级关注点和下一级关注点之间所有纵向词树;
显示纵向词树的用户关注点及其上一级关注点和下一级关注点的相关信息。
具体地,所述基础领域由人工设定,基础领域再划分子领域原则包括包含原则、因果原则、利害原则和时间原则。
具体地,还包括步骤4:根据步骤3用户的收索浏览结果更新关注点数据库以及对应的关注点纵向线索和关注点横向线索。
实施例一
例如用户搜索“糖尿病”,根据基础领域的划分属于“健康”,纵向词树一则为:健康/病症/内科/糖尿病,横向词树一为:病因/环境因素/饮食不均衡;同级关联关注点为:治疗/药物治疗/注射胰岛素;这样用户可以通过搜索获得关于糖尿病的以关注点为中心的更有逻辑性的信息,而并不是仅限于对糖尿病的初级认知。
实施例二
例如用户搜索“曼彻斯特联队”,根据基础领域的划分属于“体育”,纵向词树一则为:体育/足球/英超/曼彻斯特联队/赞助商/雪佛兰;同级关联关注点为:赛事新闻/转会引援/博格巴/身价。通过横向纵向的搜索,用户可以深入地了解关于“曼彻斯特联队”的相关信息。
实施例三
领域的纵向的例子:娱乐/明星/歌手/刘德华。领域是可以有范围理解的“名词”。关注点,更多的是“动词/方向性”,如:“八卦”、“性价比”、“治疗方法”等;是基于“领域”的“关注方向”。关注点本身是没有纵向的关系的,但是它常常可以继承“父领域”的关注点。例如:“高血压”的关注点,可以继承父领域“疾病”的所有关注点,例如:“用药”等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种信息关联搜索推荐方法,其特征在于,包括以下步骤:
步骤1:根据关注点数据库建立关注点纵向线索,根据关注点数据库的同级词建立关注点横向线索;
步骤2:输入用户关注点;
步骤3:根据步骤2中的用户关注点及步骤1中关注点纵向线索在用户关注点上一级关注点和下一级关注点之间建立一条纵向词树,同时根据步骤1中的关注点横向线索搜索出用户关注点的同级关联关注点,筛选出符合设定的纵向词树和符合设定的同级关联关注点的相关信息推送至用户。
2.如权利要求1所述的一种信息关联搜索推荐方法,其特征在于,所述步骤1中根据关注点的领域信息建立关注点纵向线索具体步骤为:
根据关注点数据库划分N个基础领域[I],根据基础领域[I]再划分子领域,根据子领域再划分若干个关注点,关注点下再划分子关注点,形成具有层级关系的关注点数据库。
3.如权利要求2所述的一种信息关联搜索推荐方法,其特征在于,所述步骤3的具体步骤为:
根据用户关注点判断用户关注点的上一级关注点和下一级关注点;
抓取包含用户关注点及其上一级关注点和下一级关注点之间所有纵向词树;
显示纵向词树的用户关注点及其上一级关注点和下一级关注点的相关信息。
4.如权利要求2所述的一种信息关联搜索推荐方法,其特征在于,所述基础领域[I]由人工设定,基础领域[I]再划分子领域原则包括包含原则、因果原则、利害原则和时间原则。
5.如权利要求1所述的基于故事逻辑性的系统实现方法,其特征在于,还包括步骤4:根据步骤3用户的收索浏览结果更新关注点数据库以及对应的关注点纵向线索和关注点横向线索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710804114.5A CN107590235A (zh) | 2017-09-08 | 2017-09-08 | 一种信息关联搜索推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710804114.5A CN107590235A (zh) | 2017-09-08 | 2017-09-08 | 一种信息关联搜索推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107590235A true CN107590235A (zh) | 2018-01-16 |
Family
ID=61051676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710804114.5A Pending CN107590235A (zh) | 2017-09-08 | 2017-09-08 | 一种信息关联搜索推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107590235A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959550A (zh) * | 2018-06-29 | 2018-12-07 | 北京百度网讯科技有限公司 | 用户关注点挖掘方法、装置、设备及计算机可读介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630314A (zh) * | 2008-07-16 | 2010-01-20 | 中国科学院自动化研究所 | 一种基于领域知识的语义查询扩展方法 |
US20120101807A1 (en) * | 2010-10-25 | 2012-04-26 | Electronics And Telecommunications Research Institute | Question type and domain identifying apparatus and method |
CN104794242A (zh) * | 2015-05-11 | 2015-07-22 | 何杨洲 | 一种搜索方法 |
-
2017
- 2017-09-08 CN CN201710804114.5A patent/CN107590235A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630314A (zh) * | 2008-07-16 | 2010-01-20 | 中国科学院自动化研究所 | 一种基于领域知识的语义查询扩展方法 |
US20120101807A1 (en) * | 2010-10-25 | 2012-04-26 | Electronics And Telecommunications Research Institute | Question type and domain identifying apparatus and method |
CN104794242A (zh) * | 2015-05-11 | 2015-07-22 | 何杨洲 | 一种搜索方法 |
Non-Patent Citations (1)
Title |
---|
罗建利: "基于用户兴趣的概念查询扩展研究", 《中国优秀博硕士学位论文全文数据库 (硕士)信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108959550A (zh) * | 2018-06-29 | 2018-12-07 | 北京百度网讯科技有限公司 | 用户关注点挖掘方法、装置、设备及计算机可读介质 |
CN108959550B (zh) * | 2018-06-29 | 2022-03-25 | 北京百度网讯科技有限公司 | 用户关注点挖掘方法、装置、设备及计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10108676B2 (en) | Filtering suggested queries on online social networks | |
US10339161B2 (en) | Expanding network relationships | |
CN103886034B (zh) | 一种建立索引及匹配用户的查询输入信息的方法和设备 | |
US8316019B1 (en) | Personalized query suggestions from profile trees | |
KR102049271B1 (ko) | 온라인 소셜 네트워크에서 검색 결과의 블렌딩 | |
US8326861B1 (en) | Personalized term importance evaluation in queries | |
EP2321745B1 (en) | Providing posts to discussion threads in response to a search query | |
US10102245B2 (en) | Variable search query vertical access | |
AU2014296446B2 (en) | Rewriting search queries on online social networks | |
US20140012859A1 (en) | Personalized dynamic content delivery system | |
KR20060131746A (ko) | 슈퍼유닛을 사용하는 검색 처리 시스템 및 방법 | |
CN103186556B (zh) | 得到和搜索结构化语义知识的方法及对应装置 | |
Tran et al. | E-Myscéal: Embedding-based Interactive Lifelog Retrieval System for LSC'22 | |
CN108228571B (zh) | 对联的生成方法、装置、存储介质及终端设备 | |
CN103186633B (zh) | 一种结构化信息抽取方法、搜索方法和装置 | |
CN109376352A (zh) | 一种基于word2vec和语义相似度的专利文本建模方法 | |
CN104035972A (zh) | 一种基于微博的知识推荐方法与系统 | |
CN106528676A (zh) | 基于人工智能的实体语义检索处理方法及装置 | |
CN107977420A (zh) | 一种演进式文档的摘要提取方法、装置及可读存储介质 | |
CN103914486B (zh) | 文档的搜索及展现的系统 | |
Roy et al. | Combining local and global word embeddings for microblog stemming | |
CN107590235A (zh) | 一种信息关联搜索推荐方法 | |
CN106021430A (zh) | 基于Lucence自定义词库的全文检索匹配方法及系统 | |
CN104794200B (zh) | 一种基于本体的支持模糊匹配的事件发布订阅方法 | |
Suebchua et al. | History-enhanced focused website segment crawler |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180116 |