CN104951501A - 一种基于粒子群算法的大数据智能搜索算法 - Google Patents
一种基于粒子群算法的大数据智能搜索算法 Download PDFInfo
- Publication number
- CN104951501A CN104951501A CN201510204990.5A CN201510204990A CN104951501A CN 104951501 A CN104951501 A CN 104951501A CN 201510204990 A CN201510204990 A CN 201510204990A CN 104951501 A CN104951501 A CN 104951501A
- Authority
- CN
- China
- Prior art keywords
- user
- large data
- big data
- particle
- engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种基于粒子群算法的大数据智能搜索算法,包括以下步骤:将用户的搜索条件键入引擎数据库;从引擎数据库中得到和搜索条件相关的大数据并作为初始化种群;将初始化种群反馈给用户;用户根据自己的搜索条件,评选出符合度最高的大数据;引擎将目标函数值评价高的大数据作为优选类,然后根据迭代步骤进行计算,计算出与用户选择相近的大数据返回给用户;如果用户在引擎中找到了需要的大数据则中止检索;否则转向步骤(2)。本发明通过粒子群算法优化的搜索引擎可以使用户参与到搜索过程中,使搜索结果最接近用户需求,这样可以保证搜索结果的正确率以及满意度。
Description
技术领域
本发明涉及一种基于粒子群算法的大数据智能搜索算法。
背景技术
大数据搜索引擎从上个世纪九十年代开始出现,经过二十多年的发展,在搜索速度及准确率都有较大的改善。而其基本架构和技术都没有太大的改变。因而它的局限性也是显而易见的。针对不同应用场合的搜索引擎,需要的信息应该有差别。目前,各大搜索引擎都是“一对多”的搜索模式。这种模式的一个检索结果适合所有检索该信息的使用者,很少做到智能化检索。缺乏识别用户感兴趣信息的能力,并且排序方式不能根据不同使用者做出相应的调整。为不同的人提供个性化的检索服务,是未来搜索引擎发展的道路之一。因而各种智能化搜索技术由此诞生。有蚁群算法、遗传算法、网络蜘蛛等算法。蚁群算法等其他算法采用群体解的竞争机制来产生最优解。而粒子群算法是采用群体解的合作机制来迭代产生最优解。此外,蚁群算法需要调节的参数偏多,如果参数设置不当,导致求解速度很慢且所得解的质量特别差。而粒子群算法概念简单、容易实现,需要调节的参数偏少。
发明内容
本发明的目的是提供一种基于粒子群算法的大数据智能搜索算法。
实现本发明目的的技术方案是一种基于粒子群算法的大数据智能搜索算法,包括以下步骤:
(1)首先根据用户的搜索条件从引擎数据库中得到和用户输入关键词相关的大数据作为初始化种群,同时将这些大数据展现给用户。每一个大数据是一个粒子Pi。粒子群的第i粒子是由三个向量组成,分别为:目前位置:Xi,历史最优位置:Pi,速度:Vi,这里i=l,2,…,n。
(2)用户根据自己的搜索条件,评选出符合度最高的大数据。
(3)引擎将目标函数值评价高的大数据作为优选类,然后根据以下迭代步骤进行计算,计算出与用户选择相近的大数据返回给用户。
对于每一个粒子,根据如下等式变化:
Vi=Vi+c1 rand() (Pi-Xi)+c2 rand() (Pg-Xi) (1)
Xi=Xi+Vi (2)
(4)如果用户在引擎中找到了需要的文本文档则中止检索,否则转向步骤(2),直到找到用户需要的大数据。
采用了上述技术方案后,本发明具有以下的积极的效果:(1)通过粒子群算法优化的搜索引擎可以使用户参与到搜索过程中,使搜索结果最接近用户需求,这样可以保证搜索结果的正确率以及满意度。(2)通过基于粒子群算法的大数据智能搜索算法有效的提高了检索效率。
表1 智能搜索引擎和普通搜索引擎结果对比
附图说明
图1为本发明的运算示意图。
具体实施方式
一种基于粒子群算法的大数据智能搜索算法,包括以下步骤:
(1)首先根据用户的搜索条件从引擎数据库中得到和用户输入关键词相关的大数据作为初始化种群,同时将这些大数据展现给用户。
每一个大数据是一个粒子Pi。粒子群的第i粒子是由三个向量组成,分别为:目前位置:Xi,历史最优位置:Pi,速度:Vi,这里i=l,2,…,n。在算法每一次迭代中,目前位置Xi作为问题解被评价。如果目前位置好于历史最优位置Pi,那么目标位置的坐标就存在第二个向量Pi。另外,整个粒子群中迄今为止搜索到的最好位置记为:Pg。
(2)用户根据自己的搜索条件,评选出符合度最高的大数据。
(3)引擎将目标函数值评价高的大数据作为优选类,然后根据以下迭代步骤进行计算,计算出与用户选择相近的大数据返回给用户。
(a)更新最优:l).比较粒子适用值与它的个体最优值Pbest,如果优于Pbest,则将其Pbest位置就是当前粒子位置。2).比较粒子适用值与群体全体最优值动 Gbest,如果目前值好于Gbest,则设置动Gbest位置就当前粒子位置;
(b)按照式(1)和(2)改变粒子的速度和位置:
Vi=Vi+c1 rand() (Pi-Xi)+c2 rand() (Pg-Xi) (1)
Xi=Xi+Vi (2)
其中加速常数cl和c2是两个非负值,这两个常数使粒子具有自我总结和向群体中优秀个体学习的能力,从而向自己的历史最优点以及群体内或领域内的全局最优点靠近。rand()是在范围[0,l]内取值的随机函数。
(c)更新粒子。
(4)如果用户在引擎中找到了需要的文本文档则中止检索,否则转向步骤(2),直到找到用户需要的大数据。
虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这些仅是举例说明,可以对本实施方式作出多种变更或修改,而不背离发明的原理和实质,本发明的保护范围仅由所附权利要求书限定。
Claims (2)
1.一种基于粒子群算法的大数据智能搜索算法,其特征在于包括以下步骤:
(1)首先根据用户的搜索条件从引擎数据库中得到和用户输入关键词相关的大数据作为初始化种群,同时将这些大数据展现给用户,每一个大数据是一个粒子Pi,粒子群的第i粒子是由三个向量组成,分别为:目前位置:Xi,历史最优位置:Pi,速度:Vi,这里i=l,2,…,n;
(2)用户根据自己的搜索条件,评选出符合度最高的大数据,
(3)引擎将目标函数值评价高的大数据作为优选类,然后根据以下迭代步骤进行计算,计算出与用户选择相近的大数据返回给用户;
对于每一个粒子,根据如下等式变化:
Vi=Vi+c1 rand() (Pi-Xi)+c2 rand() (Pg-Xi) (1)
Xi=Xi+Vi (2)
(4)如果用户在引擎中找到了需要的文本文档则中止检索,否则转向步骤(2),直到找到用户需要的大数据。
2.根据权利要求1所述的一种基于粒子群算法的大数据智能搜索算法,其特征在于:
根据用户的搜索条件从引擎数据库中得到和用户输入关键词相关的大数据作为初始化种群,每一个大数据是一个粒子Pi,粒子群的第i粒子是由三个向量组成,分别为:目前位置:Xi,历史最优位置:Pi,速度:Vi,这里i=l,2,…,n;在算法每一次迭代中,目前位置Xi作为问题解被评价,另外,整个粒子群中迄今为止搜索到的最好位置记为:Pg,对于每一个粒子,根据如下等式变化:
Vi=Vi+c1 rand() (Pi-Xi)+c2 rand() (Pg-Xi) (1)
Xi=Xi+Vi (2)
其中加速常数cl和c2是两个非负值,这两个常数使粒子具有自我总结和向群体中优秀个体学习的能力,从而向自己的历史最优点以及群体内或领域内的全局最优点靠近,rand()是在范围[0,l]内取值的随机函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510204990.5A CN104951501A (zh) | 2015-04-27 | 2015-04-27 | 一种基于粒子群算法的大数据智能搜索算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510204990.5A CN104951501A (zh) | 2015-04-27 | 2015-04-27 | 一种基于粒子群算法的大数据智能搜索算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104951501A true CN104951501A (zh) | 2015-09-30 |
Family
ID=54166160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510204990.5A Pending CN104951501A (zh) | 2015-04-27 | 2015-04-27 | 一种基于粒子群算法的大数据智能搜索算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104951501A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021658A (zh) * | 2017-12-01 | 2018-05-11 | 湖北工业大学 | 一种基于鲸鱼优化算法的大数据智能搜索方法及系统 |
CN116000069A (zh) * | 2023-02-06 | 2023-04-25 | 一夫科技股份有限公司 | 一种废弃资源的处理方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050196047A1 (en) * | 2004-02-03 | 2005-09-08 | Yuri Owechko | Object recognition system incorporating swarming domain classifiers |
CN104408518A (zh) * | 2014-11-12 | 2015-03-11 | 山东地纬数码科技有限公司 | 基于粒子群优化算法的神经网络学习优化方法 |
-
2015
- 2015-04-27 CN CN201510204990.5A patent/CN104951501A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050196047A1 (en) * | 2004-02-03 | 2005-09-08 | Yuri Owechko | Object recognition system incorporating swarming domain classifiers |
CN104408518A (zh) * | 2014-11-12 | 2015-03-11 | 山东地纬数码科技有限公司 | 基于粒子群优化算法的神经网络学习优化方法 |
Non-Patent Citations (2)
Title |
---|
刘建华: "粒子群算法的基本理论及其改进研究", 《中国博士学位论文全文数据库》 * |
罗宏: "基于改进粒子群算法的图书封面搜索引擎研究", 《情报科学》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021658A (zh) * | 2017-12-01 | 2018-05-11 | 湖北工业大学 | 一种基于鲸鱼优化算法的大数据智能搜索方法及系统 |
CN108021658B (zh) * | 2017-12-01 | 2023-05-26 | 湖北工业大学 | 一种基于鲸鱼优化算法的大数据智能搜索方法及系统 |
CN116000069A (zh) * | 2023-02-06 | 2023-04-25 | 一夫科技股份有限公司 | 一种废弃资源的处理方法及系统 |
CN116000069B (zh) * | 2023-02-06 | 2023-11-17 | 一夫科技股份有限公司 | 一种废弃资源的处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108021658B (zh) | 一种基于鲸鱼优化算法的大数据智能搜索方法及系统 | |
Sculley | Web-scale k-means clustering | |
CN110059264B (zh) | 基于知识图谱的地点检索方法、设备及计算机存储介质 | |
CN103744934A (zh) | 一种基于位置敏感哈希的分布式索引方法 | |
CN107180079B (zh) | 基于卷积神经网络以及树与哈希结合索引的图像检索方法 | |
CN113850281A (zh) | 一种基于meanshift优化的数据处理方法和装置 | |
CN103886396A (zh) | 一种人工鱼群与粒子群混合优化的确定方法 | |
Li et al. | Efficient subspace skyline query based on user preference using MapReduce | |
Gulzar et al. | A framework for evaluating skyline queries over incomplete data | |
Fan et al. | Gem: An analytic geometrical approach to fast event matching for multi-dimensional content-based publish/subscribe services | |
CN104361135A (zh) | 一种图像检索方法 | |
CN104951501A (zh) | 一种基于粒子群算法的大数据智能搜索算法 | |
CN108984633B (zh) | 一种基于节点上下文向量空间的rdf近似答案查询方法 | |
Tollari et al. | A comparative study of diversity methods for hybrid text and image retrieval approaches | |
CN110008215A (zh) | 一种基于改进的kd树并行算法的大数据搜索方法 | |
CN104573036B (zh) | 一种基于距离的求解二维空间中代表性节点集的方法 | |
Liu et al. | Research on incremental clustering | |
Gulzar et al. | D-SKY: A framework for processing skyline queries in a dynamic and incomplete database | |
John et al. | Dynamic sorting and average skyline method for query processing in spatial-temporal data | |
Zexi et al. | Cuckoo search algorithm for solving numerical integration | |
CN108614889B (zh) | 基于混合高斯模型的移动对象连续k近邻查询方法及系统 | |
Tan et al. | An improved artificial bee colony algorithm for clustering | |
CN108304449B (zh) | 基于自适应数据集划分方式的大数据Top-k查询方法 | |
Xie et al. | Study of canopy and K-means clustering algorithm based on mahout for E-commerce product quality analysis | |
Zhang et al. | Distribution-aware locality sensitive hashing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150930 |