CN101000608A - 基于搜索引擎技术的关键字动态匹配生成的方法 - Google Patents

基于搜索引擎技术的关键字动态匹配生成的方法 Download PDF

Info

Publication number
CN101000608A
CN101000608A CN 200610006536 CN200610006536A CN101000608A CN 101000608 A CN101000608 A CN 101000608A CN 200610006536 CN200610006536 CN 200610006536 CN 200610006536 A CN200610006536 A CN 200610006536A CN 101000608 A CN101000608 A CN 101000608A
Authority
CN
China
Prior art keywords
key word
search
knowledge information
generates
coupling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610006536
Other languages
English (en)
Inventor
吴风勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200610006536 priority Critical patent/CN101000608A/zh
Publication of CN101000608A publication Critical patent/CN101000608A/zh
Pending legal-status Critical Current

Links

Abstract

基于搜索引擎技术的关键字动态匹配生成的方法,借助该方法,搜索引擎可以为具体的网页、网站等互联网知识信息自动匹配生成多个搜索关键字,如此生成的多个搜索关键字随着互联网用户不断搜索点击浏览具体知识信息动态地改变排序参数并进行增减,从而将公众判断作为一种搜索属性以便提高搜索准确度,同时可以有效避免搜索引擎欺诈导致的大量垃圾SEO信息的出现,维护搜索结果的诚实性和公正性。

Description

基于搜索引擎技术的关键字动态匹配生成的方法
技术领域
本发明涉及一种基于搜索引擎技术的关键字动态匹配生成的方法,借助该方法,搜索引擎可以为具体的网页、网站等互联网知识信息自动匹配生成多个搜索关键字,如此生成的多个搜索关键字随着互联网用户不断搜索点击浏览具体知识信息动态地改变排序参数并进行增减。
背景技术
目前的互联网搜索引擎特别是全文搜索引擎技术是不完备的。由于依靠程序自动搜索数据,全文搜索引擎数据库的容量非常庞大,但是查询结果不够准确,用户往往被海量信息所包围,其中的绝大部分不为用户所需;同时,随着搜索引擎欺诈导致大量垃圾SEO信息的出现,搜索结果的诚实性和公正性日益受到威胁。
另一方面,用户使用现有互联网搜索引擎以关键字输入方式从海量信息中搜索并定位具体知识信息的行为,是通过人工对互联网程序自动生成的搜索信息进行二次识别和聚类的公众判断过程。在这个过程中,当具体用户通过输入具体关键字从海量的搜索信息中选择并点击浏览具体的知识信息时,说明该具体知识信息与该具体关键字的相关性高于其它搜索信息。但是,如何利用用户对搜索信息二次识别和聚类的行为提高搜索准确度的问题是目前搜索引擎技术很少或没有考虑到的。
发明内容
本发明的目的在于提供一种基于搜索引擎技术的关键字动态匹配生成的方法,通过用户在搜索过程中对搜索信息二次识别和聚类,搜索引擎可以为具体的网页、网站等互联网知识信息自动匹配生成多个搜索关键字,从而将公众判断作为一种搜索属性以便提高搜索准确度;另外,由于如此生成的多个搜索关键字随着互联网用户不断搜索点击浏览具体知识信息动态地改变排序参数并进行增减,可以有效避免搜索引擎欺诈导致的大量垃圾SEO信息的出现,维护搜索结果的诚实性和公正性。
本发明的目的是借助设置在互联网服务器上的程序软件系统按照以下步骤实现的:
1、搜索用户登录搜索引擎,选择搜索方式,输入搜索关键字;
2、搜索引擎的分词程序将搜索用户输入的搜索关键字切分为最小关键字;
3、搜索引擎按最小关键字在其数据库中查找给出相应搜索结果的核心内容并根据设定的规则对搜索结果排序,最后整合生成结果页面;
4、搜索用户在搜索结果页面上选择具体知识信息浏览后退出;
5、针对上述搜索用户输入并由分词程序切分出的每一个最小关键字,搜索引擎在该具体知识信息已经匹配生成的关键字库中以完全匹配查找方式查找并按下列步骤对该具体知识信息关键字进行新的匹配和生成:
1)如果找到,则根据程序增加该关键字的排序参数;
2)如果没有查找到,判断该具体知识信息原先已经匹配生成的关键字库的关键字数量是否已经达到程序设定的最大数量;如果已经达到,则根据各关键字的排序按程序删除该具体知识信息原先已经匹配生成的关键字库中的一个关键字,然后将该最小关键字设置为新的关键字并设定该关键字的初始排序参数;如果没有达到,则按程序将该最小关键字直接设置为该具体知识信息新的关键字并设定该关键字的初始排序参数。
在本发明中,具体知识信息匹配生成的关键字库中的关键字按每个关键字排序参数由大到小排序;如果排序参数相同,则随机排序。
需要说明的是,完全匹配查找方式是指,查找的关键字和被查找的关键字完全一致。例如,如果具体知识信息匹配生成的关键字库中只有一个关键字“古巴比伦”,则当搜索用户输入“古巴”进行搜索并在在搜索结果页面上选择该具体知识信息浏览后退出后,“古巴”将被设置为该具体知识信息新的关键字。
还需要说明的是,在本发明中,包含“关键字动态匹配生成”功能的搜索引擎同时为搜索用户提供“匹配生成关键字搜索”和“常规搜索”.两种可选择的搜索方式。
如果搜索用户选择使用“常规搜索”方式,则搜索引擎只查找其数据库中知识信息的除匹配生成关键字库之外的其它部分,按常规排序方式对搜索结果排序并生成结果页面。其中,常规排序方式是指,在没有包含“关键字动态匹配生成”功能前该搜索引擎采用的搜索结果的排序规则。
如果搜索用户选择使用“匹配生成关键字搜索”方式,则搜索引擎判断其数据库中知识信息是否存在匹配生成关键字库,并按下列方式继续查找搜索结果:
1)如果某个知识信息不存在匹配生成关键字库,则忽略该知识信息,对其不再进行查找;
2)如果某个知识信息存在匹配生成关键字库,则在其匹配生成关键字库中查找是否存在该搜索用户输入的已经被分词程序切分的最小关键字;如果存在,则依据命中的各匹配生成关键字的排序参数由程序计算出该知识信息的当前搜索综合排序参数;如果不存在,则忽略该知识信息,对其不再进行查找;
3)对于查找到的所有知识信息按照其当前搜索综合排序参数进行排序并整合生成结果页面。
需要说明的是,“匹配生成关键字搜索”方式排序规则为,按照查找到的知识信息的当前搜索综合排序参数由大到小排序;如果当前搜索综合排序参数相同,则随机排序。
另外,本发明说述的搜索引擎还可以采用另一种关键字动态匹配生成的方法,即当用户选择“匹配生成关键字搜索”方式时对具体知识信息关键字不进行关键字匹配和生成,只有当用户选择“常规搜索”方式时才对具体知识信息关键字进行关键字匹配和生成。
具体实施方式
下面结合具体实施例对本发明做详细说明。
在本实施例中,搜索引擎同时为搜索用户提供“匹配生成关键字搜索”方式和“常规搜索”方式两种选择。具体分别说明如下:
“常规搜索”方式:
1、搜索用户登录搜索引擎,选择“常规搜索”方式,输入搜索关键字;
2、搜索引擎的分词程序将搜索用户输入的搜索关键字切分为最小关键字;
3、搜索引擎以原有的常规方式按最小关键字在其数据库知识信息的除匹配生成关键字库外的其它部分中查找给出相应搜索结果的核心内容并根据设定的规则对搜索结果排序,最后整合生成结果页面;
4、搜索用户在搜索结果页面上选择具体知识信息浏览后退出;
5、针对上述搜索用户输入并由分词程序切分出的每一个最小关键字,搜索引擎在该具体知识信息已经匹配生成的关键字库中以完全匹配的方式查找并按下列步骤对该具体知识信息关键字进行新的匹配和生成:
1)如果找到,则该关键字的排序参数增加1;
2)如果没有查找到,判断该具体知识信息原先已经匹配生成的关键字库的关键字数量是否已经达到程序设定的最大数量10;如果已经达到,则删除该具体知识信息原先已经匹配生成的关键字库中的排序倒数第三的关键字,然后将该最小关键字设置为新的关键字并设定该关键字的初始排序参数为1;如果没有达到,则按程序将该最小关键字直接设置为该具体知识信息新的关键字并设定该关键字的初始排序参数为1。
“匹配生成关键字搜索”方式:
1、搜索用户登录搜索引擎,选择“匹配生成关键字搜索”方式,输入搜索关键字;
2、搜索引擎的分词程序将搜索用户输入的搜索关键字切分为最小关键字;
3、搜索引擎判断其数据库中知识信息是否存在匹配生成关键字库,并按下列方式继续查找搜索结果:
1)如果某个知识信息不存在匹配生成关键字库,则忽略该知识信息,对其不再进行查找;
2)如果某个知识信息存在匹配生成关键字库,则在其匹配生成关键字库中查找是否存在该搜索用户输入的已经被分词程序切分的最小关键字;如果存在,则将命中的各匹配生成关键字的排序参数的总和作为该知识信息的当前搜索综合排序参数;如果不存在,则忽略该知识信息,对其不在进行查找;
4、对于查找到的所有知识信息按照其当前搜索综合排序参数进行排序并整合生成结果页面;
5、搜索用户在搜索结果页面上选择具体知识信息浏览后退出,对该具体知识信息关键字不进行关键字匹配和生成。
其中,“匹配生成关键字搜索”方式排序规则为,按照查找到的知识信息的当前搜索综合排序参数由大到小排序;如果当前搜索综合排序参数相同,则随机排序。

Claims (9)

1.基于搜索引擎技术的关键字动态匹配生成的方法,借助设置在互联网服务器上的程序软件系统实现,其特征在于该方法按照以下步骤实现:
1)搜索用户登录搜索引擎,选择具体搜索方式,输入搜索关键字;
2)搜索引擎的分词程序将搜索用户输入的搜索关键字切分为最小关键字;
3)搜索引擎按最小关键字在其数据库中查找给出相应搜索结果的核心内容并根据设定的规则对搜索结果排序,最后整合生成结果页面;
4)搜索用户在搜索结果页面上选择具体知识信息浏览后退出;
5)针对上述搜索用户输入并由分词程序切分出的每一个最小关键字,搜索引擎在该具体知识信息已经匹配生成的关键字库中以完全匹配查找方式查找并按下列步骤对该具体知识信息关键字进行新的匹配和生成:
a)如果找到,则根据程序增加该关键字的排序参数;
b)如果没有查找到,判断该具体知识信息原先已经匹配生成的关键字库的关键字数量是否已经达到程序设定的最大数量;如果已经达到,则根据各关键字的排序按程序删除该具体知识信息原先已经匹配生成的关键字库中的一个关键字,然后将该最小关键字设置为新的关键字并设定该关键字的初始排序参数;如果没有达到,则按程序将该最小关键字直接设置为该具体知识信息新的关键字并设定该关键字的初始排序参数。
2.如权利要求1所述的关键字动态匹配生成的方法,其特征在于具体知识信息匹配生成的关键字库中的关键字按每个关键字的排序参数由大到小排序;如果排序参数相同,则随机排序。
3.如权利要求1所述的关键字动态匹配生成的方法,其特征在于完全匹配查找方式是指,查找的关键字和被查找的关键字完全一致。
4.如权利要求1所述的关键字动态匹配生成的方法,其特征在于搜索引擎同时为搜索用户提供“匹配生成关键字搜索”和“常规搜索”两种可选择的搜索方式。
5.如权利要求4所述的关键字动态匹配生成的方法,其特征在于如果搜索用户选择使用“常规搜索”方式,则搜索引擎只查找其数据库中知识信息的除匹配生成关键字库之外的其它部分,按常规排序方式对搜索结果排序并生成结果页面。
6.如权利要求5所述的关键字动态匹配生成的方法,其特征在于常规排序方式是指,搜索引擎在没有包含“关键字动态匹配生成”功能以前采用的搜索结果排序规则。
7.如权利要求4所述的关键字动态匹配生成的方法,其特征在于如果搜索用户选择使用“匹配生成关键字搜索”方式,则搜索引擎判断其数据库中知识信息是否存在匹配生成关键字库,并按下列方式继续查找搜索结果:
1)如果某个知识信息不存在匹配生成关键字库,则忽略该知识信息,对其不再进行查找;
2)如果某个知识信息存在匹配生成关键字库,则在其匹配生成关键字库中查找是否存在该搜索用户输入的已经被分词程序切分的最小关键字;如果存在,则依据命中的各匹配生成关键字的排序参数由程序计算出该知识信息的当前搜索综合排序参数;如果不存在,则忽略该知识信息,对其不再进行查找;
3)对于查找到的所有知识信息按照其当前搜索综合排序参数进行排序并整合生成结果页面。
8.如权利要求7所述的关键字动态匹配生成的方法,其特征在于“匹配生成关键字搜索”方式的排序规则为,按照查找到的知识信息的当前搜索综合排序参数由大到小排序;如果当前搜索综合排序参数相同,则随机排序。
9.如权利要求1所述的关键字动态匹配生成的方法,其特征在于搜索引擎还可以采用另一种关键字动态匹配生成的方法,即当用户选择“匹配生成关键字搜索”方式时不对具体知识信息字进行关键字匹配和生成,只有当用户选择“常规搜索”方式时才对具体知识信息字进行关键字匹配和生成。
CN 200610006536 2006-01-11 2006-01-11 基于搜索引擎技术的关键字动态匹配生成的方法 Pending CN101000608A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610006536 CN101000608A (zh) 2006-01-11 2006-01-11 基于搜索引擎技术的关键字动态匹配生成的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610006536 CN101000608A (zh) 2006-01-11 2006-01-11 基于搜索引擎技术的关键字动态匹配生成的方法

Publications (1)

Publication Number Publication Date
CN101000608A true CN101000608A (zh) 2007-07-18

Family

ID=38692585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610006536 Pending CN101000608A (zh) 2006-01-11 2006-01-11 基于搜索引擎技术的关键字动态匹配生成的方法

Country Status (1)

Country Link
CN (1) CN101000608A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102012911A (zh) * 2010-11-19 2011-04-13 清华大学 基于约束优化的专家匹配方法及系统
CN102207960A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其系统
CN102654868A (zh) * 2011-03-02 2012-09-05 联想(北京)有限公司 一种基于关键字的搜索方法、搜索装置及服务器
CN102812483A (zh) * 2010-01-25 2012-12-05 胡普兹星球信息私人有限公司 一种广告播放系统
CN101350154B (zh) * 2008-09-16 2013-01-30 北京搜狐新媒体信息技术有限公司 一种电子地图数据的排序方法及装置
CN102918532A (zh) * 2010-06-01 2013-02-06 微软公司 在搜索结果排序中对垃圾的检测
CN103034718A (zh) * 2012-12-12 2013-04-10 北京博雅立方科技有限公司 一种目标数据排序方法及装置
CN103226597A (zh) * 2013-04-19 2013-07-31 北京集奥聚合科技有限公司 基于自然语义的关键词广告匹配方法
CN106294417A (zh) * 2015-05-25 2017-01-04 阿里巴巴集团控股有限公司 一种数据排序方法、装置及电子设备
CN109154942A (zh) * 2016-07-03 2019-01-04 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
US10701181B2 (en) 2017-01-05 2020-06-30 International Business Machines Corporation Real-time resource negotiation with dynamic options

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101350154B (zh) * 2008-09-16 2013-01-30 北京搜狐新媒体信息技术有限公司 一种电子地图数据的排序方法及装置
CN102812483A (zh) * 2010-01-25 2012-12-05 胡普兹星球信息私人有限公司 一种广告播放系统
CN102812483B (zh) * 2010-01-25 2016-09-28 持久系统有限公司 一种基于背景关键字的广告播放系统
CN102918532A (zh) * 2010-06-01 2013-02-06 微软公司 在搜索结果排序中对垃圾的检测
CN102012911B (zh) * 2010-11-19 2012-11-14 清华大学 基于约束优化的专家匹配方法及系统
CN102012911A (zh) * 2010-11-19 2011-04-13 清华大学 基于约束优化的专家匹配方法及系统
CN102654868B (zh) * 2011-03-02 2015-11-25 联想(北京)有限公司 一种基于关键字的搜索方法、搜索装置及服务器
CN102654868A (zh) * 2011-03-02 2012-09-05 联想(北京)有限公司 一种基于关键字的搜索方法、搜索装置及服务器
CN102207960A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
CN102207960B (zh) * 2011-05-25 2013-10-23 盛乐信息技术(上海)有限公司 一种触控设备的搜索引擎及方法
CN102591948A (zh) * 2011-12-27 2012-07-18 厦门市美亚柏科信息股份有限公司 一种基于用户行为分析的搜索结果改进的方法及其系统
CN103034718A (zh) * 2012-12-12 2013-04-10 北京博雅立方科技有限公司 一种目标数据排序方法及装置
CN103034718B (zh) * 2012-12-12 2016-07-06 北京博雅立方科技有限公司 一种目标数据排序方法及装置
CN103226597A (zh) * 2013-04-19 2013-07-31 北京集奥聚合科技有限公司 基于自然语义的关键词广告匹配方法
CN106294417A (zh) * 2015-05-25 2017-01-04 阿里巴巴集团控股有限公司 一种数据排序方法、装置及电子设备
CN109154942A (zh) * 2016-07-03 2019-01-04 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
CN109154942B (zh) * 2016-07-03 2022-04-01 株式会社咕嘟妈咪 信息提供方法、信息提供程序及信息提供装置
US10701181B2 (en) 2017-01-05 2020-06-30 International Business Machines Corporation Real-time resource negotiation with dynamic options

Similar Documents

Publication Publication Date Title
CN101000608A (zh) 基于搜索引擎技术的关键字动态匹配生成的方法
US6665837B1 (en) Method for identifying related pages in a hyperlinked database
KR100699977B1 (ko) 데이터베이스 검색 시스템에서 관련 검색을 식별하기 위한방법 및 장치
US6594654B1 (en) Systems and methods for continuously accumulating research information via a computer network
US6795820B2 (en) Metasearch technique that ranks documents obtained from multiple collections
JP5575902B2 (ja) クエリのセマンティックパターンに基づく情報検索
TWI512506B (zh) Sorting method and device for search results
US20090006388A1 (en) Search result ranking
WO2008098502A1 (fr) Procédé et dispositif destinés à créer un index et procédé et système de récupération
CN101685521A (zh) 在网页中展现广告的方法及系统
CN102043833A (zh) 一种基于查询词进行搜索的方法和搜索装置
JP2013506189A (ja) クエリの一般属性に基づく情報の検索
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
CN103577416A (zh) 扩展查询方法及系统
CN103970754A (zh) 文章的自动选取方法及装置
TWI549004B (zh) Search Method Based on Online Trading Platform and Establishment Method of Device and Web Database
WO2009152469A1 (en) Systems and methods for classifying search queries
US20070168346A1 (en) Method and system for implementing two-phased searching
CN104021125A (zh) 一种搜索引擎排序的方法、系统以及一种搜索引擎
CN102364467A (zh) 一种网络搜索方法和系统
WO2014059848A1 (zh) 一种网页搜索设备和方法
CN102063454A (zh) 一种搜索与应用相结合的方法和设备
CN103164425B (zh) 应用程序平台系统中推送应用程序的方法和装置
CN103970800A (zh) 网页相关关键词的抽取处理方法和系统
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication