CN103365915A - 基于搜索引擎和数据库查询系统的搜索结果排名方法 - Google Patents

基于搜索引擎和数据库查询系统的搜索结果排名方法 Download PDF

Info

Publication number
CN103365915A
CN103365915A CN 201210101199 CN201210101199A CN103365915A CN 103365915 A CN103365915 A CN 103365915A CN 201210101199 CN201210101199 CN 201210101199 CN 201210101199 A CN201210101199 A CN 201210101199A CN 103365915 A CN103365915 A CN 103365915A
Authority
CN
China
Prior art keywords
enterprise
service
search
search result
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201210101199
Other languages
English (en)
Other versions
CN103365915B (zh
Inventor
文飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING EMOTTE INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BEIJING EMOTTE INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING EMOTTE INFORMATION TECHNOLOGY Co Ltd filed Critical BEIJING EMOTTE INFORMATION TECHNOLOGY Co Ltd
Priority to CN201210101199.8A priority Critical patent/CN103365915B/zh
Publication of CN103365915A publication Critical patent/CN103365915A/zh
Application granted granted Critical
Publication of CN103365915B publication Critical patent/CN103365915B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种基于搜索引擎和数据库查询系统的搜索结果排名方法,应用于给服务搜索匹配的企业的场景和领域;离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量企业会在搜索结果里排在前面,以尽可能符合用户的需求。同时动态的统计分析所匹配的企业的业务数据量,依据企业的服务能力动态的调整企业的匹配优先级,以避免企业服务能力不足问题的出现。

Description

基于搜索引擎和数据库查询系统的搜索结果排名方法
技术领域
本申请涉及搜索结果排名方法,尤其涉及一种基于搜索引擎和数据库查询系统的搜索结果排名方法。
背景技术
搜索引擎提供强大的工具来定位在大型文档数据库中的文档中的内容。响应与搜索查询使用文档的索引来定位文档,搜索查询由用户提交的一个或者多个词、词语、关键词和/或短语组成。可以将在文档的索引中的文档与搜索查询的一个或者多个词语匹配以确定分值。基于分值,将相关文档或者文档位置的排名的列表提供给用户。
中文搜索引擎的核心是分词技术。分词技术是利用一定的规则和词库,切分出一个句子中的词,为自动索引做好准备。目前的索引多采用Non-clustered方法,该技术和语言文字的学问有很大的关系,具体有如下几点:
(1)存储语法库,和词汇库配合分出句子中的词汇;
(2)存储词汇库,要同时存储词汇的使用频率和常见搭配方式;
(3)词汇库,应可划分为不同的专业库,以便于处理专业文献;
(4)对无法分词的句子,把每个字当作词来处理。
网络关键词搜索系统的搜索结果提供,一般都采用按匹配加权的方式加以排序显示,即在返回全部搜索结果的同时,按照与搜索需求的符合程度排序显示,以便将最符合用户需求的资源在前面显示,在保持检全率的同时提高检准率。这种排序方式在通常的搜索业务中有不错的表现效果,但在某些特定的搜索领域会体现出局限性。首先,它无法体现搜索结果跟用户位置的相关性;其次,针对特定的搜索领域文档的特定属性会体现出较高的权重,必须特殊处理;不同文档本身的重要性在特定的搜索领域也需要单独定义。此外,同样条件的搜索每次检索出来的结果都是一样的,这会导致用户对搜索结果前几条的集中访问,在特定的搜索领域,既造成了前几条展示搜索对象的业务堵塞,也造成了后面搜索结果对象没有业务量。
发明内容
本申请提供一种基于搜索引擎和数据库查询系统的搜索结果排名方法和系统,此搜索引擎及排名方法和系统应用于给服务搜索匹配的企业的场景和领域;可以同时根据用户提交的搜索条件,按照企业到服务地点的距离给予综合评分,这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量企业会在搜索结果里排在前面,以尽可能符合用户的需求。同时动态的统计分析所匹配的企业的业务数据量,依据企业的服务能力动态的调整企业的匹配优先级,以避免企业服务能力不足问题的出现。
为实现上述目的,本申请实施例提供了一种搜索结果排名方法,是这样实现的:
在数据索引模块,对企业数据的ID,名称,地址,服务分类,经纬度等各字段分别进行索引存储,其中名称,地址,服务分类等文本字段进行分词后索引,企业ID,经纬度等字段按照数字格式进行索引(不分词);同时,根据企业的硬件资质,服务质量,服务能力,信誉度等给予企业不同的索引权重。
在搜索模块,定义一个搜索接口,以接收用户对服务地点附近的某一服务分类企业的搜索;
在匹配算法里,首先满足用户搜索的必要条件。匹配结果的排序通过综合评分实现,分值高的排序展示在前面。即综合评分=搜索匹配度+企业评分+主营业务符合度+距离匹配度-业务量指数+其他排序指数。搜索匹配度为企业信息与用户提交的文本搜索关键字的匹配度,由通常的搜索引擎匹配算法实现。企业评分为企业在系统中的综合评分,包含对企业各方面包括硬件资质,服务质量,服务能力,信誉度等指标的综合评价。主营业务符合度是指企业的主营业务包含用户提交的服务分类查询条件则为1,否则为0。对于特定的服务分类,在服务半径内的企业,根据距离服务地点的远近计算的分值为距离匹配度,对于服务半径外的企业,此分值为0,在服务半径内的企业,其分值为1-距离服务地点的距离/服务半径。业务量指数为企业近期接受服务量与服务能力的比值,服务能力趋近于0则表示该企业已经业务量饱和,很难再提供服务。这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量,具有高服务能力的企业会在搜索结果里排在前面。
为实现上述目的,本申请实施例提供了一种搜索结果排名系统。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作介绍,下面描述中的附图仅仅是本申请中记载的一些实施例。
图1为本申请搜索结果排名方法的第一实施例框图。
具体实施方式
本申请实施例提供一种搜索结果排名方法。
在数据索引模块,索引线程实时监测数据库中企业数据的变化,对更新的企业数据进行实时索引、更新。对企业数据的ID,名称,地址,服务分类,经纬度等各字段分别进行索引存储,其中名称,地址,服务分类等文本字段进行分词后索引,企业ID,经纬度等字段按照数字格式进行索引(不分词);同时,根据企业的硬件资质,服务质量,服务能力,信誉度等给予企业不同的索引权重。比如,默认所有企业的权重都是1,对于每个企业都有自己的硬件资质,服务质量,服务能力,信誉度等的单项分值,对于各项分值总和在前10%的企业,定义为推荐的高质量企业,在索引的时候,给予较高的索引权重,比如2。
在搜索模块,定义一个搜索接口,可以接收用户对某一中心点附近的某一服务分类企业的搜索。在匹配算法里,首先满足用户搜索的必要条件,如搜索的城市,服务分类,。匹配结果的排序通过综合评分实现,分值高的排序展示在前面。即综合评分=搜索匹配度+企业评分+主营业务符合度+距离匹配度+业务量指数+其他排序指数。搜索匹配度为企业信息与用户提交的文本搜索关键字的匹配度,由通常的搜索引擎匹配算法实现,根据用户输入的搜索关键字在企业信息中出现的字段,位置,频率等确定。企业评分为企业在系统中的综合评分,包含对企业各方面包括硬件资质,服务质量,服务能力,信誉度等指标的综合评价。主营业务符合度是指企业的主营业务包含用户提交的服务分类查询条件则为1,否则为0。对于特定的服务分类,在服务半径内的企业,根据距离服务地点的远近计算的分值为距离匹配度,对于服务半径外的企业,此分值为0,在服务半径内的企业,其分值为1-距离服务地点的距离/服务半径。业务量指数为企业近期接受服务量与服务能力的比值,服务能力趋近于0则表示该企业已经业务量饱和,很难再提供服务,此指数会根据企业的接单情况及回访情况动态更新。其他排序指数是指根据具体业务相关的其他排序指数,比如满足条件的服务人员的数量也可作为排序的参考指数。这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的高质量,具有高服务能力的企业会在搜索结果里排在前面。
给用户匹配服务企业后,更新企业的匹配记录和服务记录,从而动态影响企业的业务量指数,进而影响后续的搜索排序。
在对整个服务过程进行跟踪回访后,更新企业的服务记录和评价记录,从而动态影响企业的业务量指数,企业信誉度,服务能力等,索引进程将监控这些变化并即时更新索引,进而影响后续的搜索排序。
整个过程形成一个完整的闭环。

Claims (7)

1.一种基于搜索引擎和数据库查询系统的搜索结果排名方法,其特征在于,包括以下步骤:
a)索引模块对数据库表中变化的数据进行实时索引:
b)在搜索模块,定义一个搜索接口,以接收用户对特定服务地点附近的某一服务分类企业的搜索;
c)给予主营业务为该服务分类的企业以较高优先级,给予非主营业务为该服务分类的企业较低优先级,同时按照企业到服务地点的距离给予一个综合评分,这样,离用户提交的服务地点最近的,主营业务为搜索服务分类的系统推荐的优质企业会在搜索结果里排在前面;
d)匹配完成后动态修改企业的业务量指数进而影响后续的匹配结果。
2.根据权利要求1所述的搜索结果排名方法,其特征在于,综合评分还包括:搜索匹配度,搜索匹配度为企业信息与用户提交的文本搜索关键字的匹配度,由通常的搜索引擎匹配算法实现。
3.根据权利要求1所述的搜索结果排名方法,其特征在于,综合评分还包括:企业评分,企业评分为企业在系统中的综合评分,包含对企业各方面包括硬件资质,服务质量,服务能力,信誉度等指标的综合评价。
4.根据权利要求1所述的搜索结果排名方法,其特征在于,综合评分还包括:主营业务符合度,主营业务符合度是指企业的主营业务包含用户提交的服务分类查询条件则为1,否则为0。
5.根据权利要求1所述的搜索结果排名方法,其特征在于,综合评分还包括业务量指数,业务量指数为企业近期接受服务量与服务能力的比值,服务能力趋近于0则表示该企业已经业务量饱和,很难再提供服务。
6.根据权利要求1所述的搜索结果排名方法,其特征在于,综合评分还包括:其他排序指数,其他排序指数指企业的信誉度。
7.根据权利要求1所述的搜索结果排名方法,其特征在于,还包括以下步骤:跟踪整个服务过程,动态调整企业的服务能力,信誉度,业务量指数等,实时更新索引,形成一个闭环。
CN201210101199.8A 2012-04-10 2012-04-10 基于搜索引擎和数据库查询系统的搜索结果排名方法 Expired - Fee Related CN103365915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210101199.8A CN103365915B (zh) 2012-04-10 2012-04-10 基于搜索引擎和数据库查询系统的搜索结果排名方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210101199.8A CN103365915B (zh) 2012-04-10 2012-04-10 基于搜索引擎和数据库查询系统的搜索结果排名方法

Publications (2)

Publication Number Publication Date
CN103365915A true CN103365915A (zh) 2013-10-23
CN103365915B CN103365915B (zh) 2017-09-05

Family

ID=49367279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210101199.8A Expired - Fee Related CN103365915B (zh) 2012-04-10 2012-04-10 基于搜索引擎和数据库查询系统的搜索结果排名方法

Country Status (1)

Country Link
CN (1) CN103365915B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287404A (zh) * 2019-05-20 2019-09-27 昆明理工大学 一种基于5g网络和人工神经网络的数据定向爆炸系统和方法
CN110297857A (zh) * 2019-07-05 2019-10-01 刘大谋 一种智能化用户终端服务平台及展示方法
CN110334277A (zh) * 2019-06-28 2019-10-15 北京天眼查科技有限公司 用户搜索行为的识别方法及装置
CN111159488A (zh) * 2019-11-25 2020-05-15 国网湖南省电力有限公司 一种基于微服务架构的电网搜索系统及方法
CN113190649A (zh) * 2021-04-16 2021-07-30 量子数聚(北京)科技有限公司 基于ElasticSearch的企业名称搜索匹配方法及装置
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113378055A (zh) * 2021-06-24 2021-09-10 上海微问家信息技术有限公司 基于访客信息的企业推送方法、装置、设备及存储介质
CN115965335A (zh) * 2022-12-13 2023-04-14 中诚智信工程咨询集团股份有限公司 全过程工程咨询信息管理方法及系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287404A (zh) * 2019-05-20 2019-09-27 昆明理工大学 一种基于5g网络和人工神经网络的数据定向爆炸系统和方法
CN110334277A (zh) * 2019-06-28 2019-10-15 北京天眼查科技有限公司 用户搜索行为的识别方法及装置
CN110297857A (zh) * 2019-07-05 2019-10-01 刘大谋 一种智能化用户终端服务平台及展示方法
CN111159488A (zh) * 2019-11-25 2020-05-15 国网湖南省电力有限公司 一种基于微服务架构的电网搜索系统及方法
CN113190649A (zh) * 2021-04-16 2021-07-30 量子数聚(北京)科技有限公司 基于ElasticSearch的企业名称搜索匹配方法及装置
CN113343046A (zh) * 2021-05-20 2021-09-03 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113343046B (zh) * 2021-05-20 2023-08-25 成都美尔贝科技股份有限公司 一种智能搜索排序系统
CN113378055A (zh) * 2021-06-24 2021-09-10 上海微问家信息技术有限公司 基于访客信息的企业推送方法、装置、设备及存储介质
CN115965335A (zh) * 2022-12-13 2023-04-14 中诚智信工程咨询集团股份有限公司 全过程工程咨询信息管理方法及系统

Also Published As

Publication number Publication date
CN103365915B (zh) 2017-09-05

Similar Documents

Publication Publication Date Title
US11899638B2 (en) Token based dynamic data indexing with integrated security
US12056120B2 (en) Deriving metrics from queries
CN103365915A (zh) 基于搜索引擎和数据库查询系统的搜索结果排名方法
US9165074B2 (en) Systems and methods for performing geo-search and retrieval of electronic point-of-interest records using a big index
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
US20230273923A1 (en) Generating and/or utilizing a machine learning model in response to a search request
US9734192B2 (en) Producing sentiment-aware results from a search query
JP6538277B2 (ja) 検索クエリ間におけるクエリパターンおよび関連する総統計の特定
CN110928903B (zh) 数据提取方法及装置、设备和存储介质
TW201805839A (zh) 資料處理方法、設備及系統
CN103425687A (zh) 一种基于关键词的检索方法和系统
WO2020248378A1 (zh) 业务查询方法、装置及存储介质、计算机设备
US10185751B1 (en) Identifying and ranking attributes of entities
CN103020049A (zh) 搜索方法及搜索系统
KR101290325B1 (ko) 이동 단말기의 위치 로그 기반의 개인화된 여행지 컨텐츠 검색 방법 및 이를 수행하는 여행지 컨텐츠 검색 시스템
CN111444304A (zh) 搜索排序的方法和装置
CN103365914A (zh) 基于搜索引擎的数据库查询系统和方法
US20190065502A1 (en) Providing information related to a table of a document in response to a search query
CN104077327B (zh) 核心词重要性识别方法和设备及搜索结果排序方法和设备
CN108959580A (zh) 一种标签数据的优化方法及系统
CN108475266A (zh) 用来移除匹配文档的匹配修复
KR101231438B1 (ko) 외래어 발음 검색 서비스를 제공하는 검색결과 제공 시스템 및 방법
CN102385597B (zh) 一种poi的容错搜索方法
CN111126073B (zh) 语义检索方法和装置
US12093265B2 (en) Semantics based data and metadata mapping

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
DD01 Delivery of document by public notice

Addressee: Beijing Emotte Information Technology Co., Ltd.

Document name: Notification of Publication of the Application for Invention

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
DD01 Delivery of document by public notice

Addressee: Beijing Emotte Information Technology Co., Ltd.

Document name: Notification of Patent Invention Entering into Substantive Examination Stage

DD01 Delivery of document by public notice

Addressee: Chen Xiaoling

Document name: Notification of Passing Examination on Formalities

GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 100043 Beijing City, Shijingshan District Shijingshan Road No. 22 building 14 layer 1412 million

Patentee after: Beijing Yi Meng world information technology Limited by Share Ltd

Address before: 100088, building 3, building 3, No. 9935, West well road, Badachu hi tech park, Beijing, Shijingshan District

Patentee before: Beijing Emotte Information Technology Co., Ltd.

CP03 Change of name, title or address
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Search result ranking method based on search engine and database query system

Effective date of registration: 20191121

Granted publication date: 20170905

Pledgee: Beijing technology intellectual property financing Company limited by guarantee

Pledgor: Beijing Yi Meng world information technology Limited by Share Ltd

Registration number: Y2019990000558

PE01 Entry into force of the registration of the contract for pledge of patent right
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170905

Termination date: 20210410