CN103218373B - 一种相关搜索系统、方法及装置 - Google Patents

一种相关搜索系统、方法及装置 Download PDF

Info

Publication number
CN103218373B
CN103218373B CN201210018974.3A CN201210018974A CN103218373B CN 103218373 B CN103218373 B CN 103218373B CN 201210018974 A CN201210018974 A CN 201210018974A CN 103218373 B CN103218373 B CN 103218373B
Authority
CN
China
Prior art keywords
literal
search
matching
search result
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210018974.3A
Other languages
English (en)
Other versions
CN103218373A (zh
Inventor
高小平
宋国龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shiji Guangsu Information Technology Co Ltd filed Critical Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority to CN201210018974.3A priority Critical patent/CN103218373B/zh
Publication of CN103218373A publication Critical patent/CN103218373A/zh
Application granted granted Critical
Publication of CN103218373B publication Critical patent/CN103218373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种相关搜索系统、方法及装置,本发明在互联网网络侧提供候选数据库外,还提供语义相关性数据库,该数据库中存储与关键词匹配的语义索引。当搜索引擎接收客户端发送的搜索请求后,解析得到关键词,不仅在候选数据库中查找匹配的字面索引并根据字面相似度计算得到字面搜索结果,而且在语义相关性数据库查找匹配的语义索引得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终搜索结果。这样,本发明提供的方法及系统不仅可以搜索到与关键词相匹配的字面结果,而且可以搜索到与关键词相匹配的语义结果,提高搜索准确度,提高用户的体验度。

Description

一种相关搜索系统、方法及装置
技术领域
本发明涉及搜索引擎技术,特别涉及一种相关搜索系统、方法及装置。
背景技术
随着互联网的发展,通过互联网网络侧可以为客户端提供各种服务。其中一种就是搜索服务,也就是在网络侧设置搜索引擎,当网络侧的搜索引擎接收客户端发送的搜索请求后,检索互联网网络侧候选数据库中所存储的匹配该搜索请求携带的关键词的所有字面索引,提供给客户端。为了提高使用客户端的用户搜索体验度,提出了相关搜索技术,也就是网络侧的搜索引擎在接收搜索请求后,不仅仅检索互联网网络侧候选数据库中匹配该搜索请求携带的关键词的所有字面索引,还检索互联网网络侧候选数据库所存储的匹配该搜索请求携带的关键词的相关或相近字面索引,提供给客户端,用于用户的进一步搜索。
图1为现有技术互联网网络侧提供的搜索服务示意图,包括客户端、网络侧提供的搜索引擎及网络侧提供的候选数据库,其中,
客户端,用于向搜索引擎发送搜索请求,该搜索请求携带关键词,接收搜索引擎返回的搜索结果;
搜索引擎,用于接收搜索请求,到候选数据库中查找匹配该请求所携带关键词的相关或相同字面索引,得到搜索结果,返回给客户端;
候选数据库,用于对应关键词存储相同或相关字面索引。
具体地,图2为现有技术搜索引擎的结构示意图,包括:查询解析模块、检索模块及字面相关度计算模块,其中,
查询解析模块,用于从所接收到的搜索请求中,进行查询解析,得到所携带的关键词;
查询模块,用于到候选数据库中查找匹配该请求所携带关键词的所有相关或相同字面索引;
字面相关度计算模块,用于分别计算所查找到的所有相关或相同字面索引与关键词的字面相似度,将所设定数量的字面相似度最高的相关或相同字面索引反馈给客户端。
从上述方案可以看出,目前只是采用单一的候选数据库进行搜索请求携带的关键词的相关或相同字面索引匹配,且采用字面相关度计算得到字面相似度最高的设定数量的相关或相同字面结果反馈给客户端。这样,只能得到搜索请求所携带的与关键词匹配的相关或相同字面结果,而无法得到相关或相同语义结果,这会降低用户的体验度。
发明内容
有鉴于此,本发明提供一种相关搜索方法,能够提高搜索的准确度。
本发明还提供一种相关搜索装置,能够提高搜索的准确度。
本发明还提供一种相关搜索系统,能够提高搜索的准确度。
为达到上述目的,本发明的技术方案是这样实现的:
一种相关搜索方法,该方法包括:
接收携带关键词的搜索请求,解析搜索请求得到关键词;
在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找与关键词匹配的语义索引得到语义搜索结果;
将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果。
该方法还包括:
在设置的快速更新数据库查找与关键词匹配的更新字面索引,根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
所述解析搜索请求得到关键词具体为:
采用反文档频率idf方式从搜索请求解析得到关键词。
所述根据字面相似度从匹配的字面索引中计算得到字面搜索结果具体为:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
一种相关搜索装置,包括:收发模块、解析模块、检索模块、字面相似度计算模块、语义相似度计算模块及融合模块,其中,
收发模块,用于接收携带关键词的搜索请求,发送从融合模块得到的最终匹配关键词的搜索结果;
解析模块,用于从搜索请求中解析关键词;
检索模块,用于在候选数据库中查找与关键词匹配的字面索引,在语义相关性数据库查找与关键词匹配的语义索引;
字面相似度计算模块,用于根据字面相似度从匹配的字面索引中计算得到字面搜索结果;
融合模块,用于将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果。
检索模块,还用于在快速更新数据库查找与关键词匹配的更新字面索引;
字面相似度计算模块,还用于根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果;
融合模块,还用于在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
所述解析模块,具体用于:
采用反文档频率idf方式从搜索请求解析得到关键词。
所述字面相似度计算模块具体用于:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
一种相关搜索系统,包括:客户端、搜索引擎、候选数据库及语义相关性数据库,其中,
客户端,用于向搜索引擎发送搜索请求,该搜索请求携带关键词,接收搜索引擎返回的搜索结果;
搜索引擎,用于接收搜索请求,解析搜索请求得到关键词,在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找与关键词匹配的语义索引得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果,返回给客户端;
候选数据库,用于对应关键词存储字面索引;
语义相关性数据库,用于对应关键词存储语义索引。
所述系统还包括快速更新数据库,用于对应关键词存储更新字面索引;
所述搜索引擎,还用于在快速更新数据库查找与关键词匹配的更新字面索引,根据字面相似度计算从匹配的更新字面索引中得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
由上述的技术方案可见,本发明在互联网网络侧提供候选数据库外,还提供语义相关性数据库,该数据库中存储与与关键词匹配的语义索引。当搜索引擎接收客户端发送的搜索请求后,从搜索请求解析得到关键词,不仅在候选数据库中查找与关键词匹配的字面索引并根据字面相似度计算得到字面搜索结果,而且在语义相关性数据库查找与关键词匹配的语义索引计算得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终搜索结果。这样,本发明提供的方法及系统不仅可以搜索到与关键词相匹配的字面索引,而且可以搜索到与关键词相匹配的语义索引,提高搜索的准确度,提高用户的体验度。
附图说明
图1为现有技术互联网网络侧提供的搜索服务示意图;
图2为现有技术搜索引擎的结构示意图;
图3为本发明实施例提供的相关搜索系统结构示意图;
图4为本发明实施例提供的相关搜索方法流程图;
图5为本发明实施例提供的相关搜索装置结构示意图;
图6为本发明实施例采用加权计算得到最终匹配关键词的搜索结果的示意图;
图7所示的本发明实施例提供的更新方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明作进一步地详细描述。
为了不仅可以搜索到与关键词相匹配的字面索引,而且可以搜索到与关键词相匹配的语义索引,提高搜索的准确度,提高用户体验度,本发明在互联网网络侧提供候选数据库外,还提供语义相关性数据库,该数据库中存储与与关键词匹配的语义索引。当搜索引擎接收客户端发送的搜索请求后,从搜索请求解析得到关键词,不仅在候选数据库中查找与关键词匹配的字面索引并根据字面相似度计算得到字面搜索结果,而且在语义相关性数据库查找与关键词匹配的语义索引计算得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终搜索结果。
在本发明提供的实施例中,由于候选数据库中存储了匹配关键词的所有字面索引,在更新时间代价较高,一些非常新的字面索引不能快速进入到该候选数据库中,导致最终得到的搜索结果时新性不高。因此,为了克服这个问题,本发明还在互联网网络侧设置快速更新数据库,存储匹配关键词的更新字面索引,在进行字面索引搜索时,也在该快速更新数据库中搜索,以获取匹配关键词的更新字面索引并根据字面相似度计算得到更新字面搜索结果,在得到最终搜索结果时,也依据了这些更新字面搜索结果。
图3为本发明实施例提供的相关搜索系统结构示意图,包括:客户端、搜索引擎、候选数据库及语义相关性数据库,其中,
客户端,用于向搜索引擎发送搜索请求,该搜索请求携带关键词,接收搜索引擎返回的搜索结果;
搜索引擎,用于接收搜索请求,从搜索请求解析关键词,在候选数据库中查找匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找匹配的语义索引计算得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果,返回给客户端;
候选数据库,用于对应关键词存储字面索引;
语义相关性数据库,用于对应关键词存储语义索引。
在该系统中,还包括快速更新数据库,用于对应关键词存储更新字面索引;
所述搜索引擎,还用于在快速更新数据库查找匹配的更新字面索引,根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
在该系统中,搜索引擎,还用于采用反文档频率(idf,inverse documentfrequency)方式从搜索请求解析得到关键词。
在该系统中,搜索引擎,具体用于采用关键词权重加权方式进行字面相似度计算,从匹配的字面索引中计算得到字面搜索结果。
在该系统中,加权方式为线性加权方式。
图4为本发明实施例提供的相关搜索方法流程图,其具体步骤为:
步骤401、互联网网络侧的搜索引擎接收到客户端发送的携带关键词的搜索请求;
步骤402、搜索引擎解析出搜索请求中的关键词;
在本步骤中,从搜索请求中解析出关键词;
在本步骤中,根据idf计算,采用idf较高的词作为关键词;
步骤403、搜索引擎在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果;
在本步骤中,进行字面相似度计算时,采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果;
步骤404、搜索引擎在语义相关性数据库查找与关键词匹配的语义索引,得到语义搜索结果;
在本步骤中,采用查询数据库的方式获取对应的语义相关性高的语义索引;
步骤405、搜索引擎将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果;
在本步骤中,加权计算为线性加权方式。
步骤406、搜索引擎将得到的最终匹配关键词的搜索结果发送给客户端。
在该方法中,步骤403和步骤404的顺序可以倒换或同时进行,这里不限制。
在该方法中,搜索引擎,还到快速更新数据库查找匹配的更新字面索引,根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
图5为本发明实施例提供的相关搜索装置结构示意图,包括:收发模块、解析模块、检索模块、字面相似度计算模块、语义相似度计算模块及融合模块,其中,
收发模块,用于接收客户端发送的携带关键词的搜索请求,发送给解析模块,接收融合模块发送的最终匹配关键词的搜索结果,发送给客户端;
解析模块,用于从搜索请求中解析关键词,发送给检索模块;
检索模块,用于在候选数据库中查找匹配的字面索引,发送给字面相似度计算模块,在语义相关性数据库查找匹配的语义索引,发送给融合模块;
字面相似度计算模块,用于根据字面相似度从匹配的字面索引中计算得到字面搜索结果,发送给融合模块;
融合模块,用于将从字面相似度计算模块接收的字面搜索结果和从检索模块接收的语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果,发送给收发模块。
在该装置中,检索模块,还用于在快速更新数据库查找匹配的更新字面索引,发送给语义相似度计算模块;
字面相似度计算模块,还用于根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,发送给融合模块;
融合模块,还用于在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
在该实施例中,所述解析模块,用于从搜索请求中解析关键词具体为:
采用反文档频率idf方式从搜索请求解析得到关键词。
在该实施例中,所述字面相似度计算模块,用于从匹配的字面索引中计算得到字面搜索结果具体为:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
在本发明实施例中,搜索引擎是根据idf提取出关键词,然后在候选数据库中查找匹配的字面索引并根据字面相似度计算得到字面搜索结果,以下详细说明这一过程。
在搜索请求中携带有文件,搜索引擎采用切分查询方式,比如采用常用的正向最大匹配或逆向最大匹配算法等,获取文件中的各个切分词;
然后获取各个切分词的权重,采用idf表示各个词的词权重,idf是一个词普遍重要性的度量,某一词的idf,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到,如公式(1):
公式(1)
其中,|D|为总文件数目,|{j:ti∈dj}包含词ti的文件数目,如果该词不在文件中,就会导致被除数为0,因此一般情况下可以使用|{j:ti∈dj}|+1表示。
最后,选取idf最高的词作为关键词,在候选数据库中查找与关键词匹配的字面索引。
在候选数据库中查找匹配关键词的字面索引时,采用反向字面索引方式,举一个具体例子说明。
假设字面索引为:
T0 “it is what it is”
T1 “what is it”
T2 “it is a banana”
得到的反向字面索引为:
“a” {2}
“banana” {2}
“is” {0,1,2}
“it” {0,1,2}
“what” {0,1}
如果关键词为“what”,“is”和“it”,则对应的集合为:
{0,1}∩{0,1,2}∩{0,1,2}={0,1}。
对关键词,得到反向字面索引,包括关键词对应的字面索引标识及在字面索引中的位置,比如关键词“banana”的字面索引为{(2,3)},就是说字面索引“banana”在第三个字面索引中(T2),且在第三个字面索引中的位置是第四个单词,地址为3。
“a” {(2,2)}
“banana” {(2,3)}
“is” {(0,1),(0,4),(1,1),(2,1)}
“it” {(0,0),(0,3),(1,2),(2,0)}
“what” {(0,2),(1,0)}
如果关键词为“what is it”,则与该与关键词匹配的字面索引为字面索引0和字面索引1。
根据字面相似度计算得到字面搜索结果
关键词的字面相似度,是根据关键词的权重与文件中所有词的权重之和的比例计算,其中权重可以采用IDF表示,字面相似度fh采用公式(2)表示:
其中Q为关键词,H为得到的字面索引,idfw表示关键词的权重。该公式利用关键词中与字面索引的公共部分的权重占得到的字面索引中所有词权重的比例描述字面搜索结果,无论从原始搜索的角度来看得到的字面搜索结果,还是从得到的字面搜索结果的角度来看原始搜索,该权重是一致的。例如:当关键词为“封神榜全集”,得到的匹配字面索引为“封神榜下载”的字面相似度就是“封神榜”的权重与“封神榜”、“全集”、“下载”这3个词的权重的比例。
字面相似度fh还可以采用公式(3)表示:
公式(3)利用关键词中与字面索引的公共部分的权重占关键词中所有词权重的比例描述字面搜索结果。例如,当关键词为“封神榜”,得到的匹配字面索引为“封神榜下载”的字面相似度就是“封神榜”的权重与关键词“封神榜”自身的权重的比例,就是fh为1。
在本发明实施例中,搜索引擎到语义相关性数据库查找匹配的语义索引过程与字面索引不同,语义相似度计算得到语义搜索结果,是在语义相关性数据库查找匹配的语义索引得到的。
例如:关键词“孙悟空的演员”在语义检索过程中可以检索出“三国演义的演员”和“六小龄童”。
在本发明实施例中,搜索引擎根据字面搜索结果和语义搜索结果采用加权计算,得到最终匹配关键词的搜索结果的具体过程如下所述。
如图6所示,图6为本发明实施例采用加权计算得到最终匹配关键词的搜索结果的示意图,如图所示:
对于关键词“Q”,搜索引擎在候选数据中匹配字面索引,并计算得到字面搜索结果,在语义相关性数据库1和语义相关性数据库2匹配语义索引,并计算得到语义搜索结果,搜索引擎还可以在快速更新数据中匹配更新字面索引,并计算得到更新字面搜索结果。其中,对于关键词“Q”,得到的字面搜索结果A、B和C为:{(A,0.5),(B,0.3),(C,0.2)};得到的更新字面搜索结果B和C为:{(B,0.1),(C,0.2)};得到的语义搜索结果B和D为:{(B,0.2)(D,0.2)}。
采用加权计算上述得到的结果,可以采用线性加权方式计算对于关键词“Q”的搜索结果H,公式(4):
其中的i表示索引,αi表示第i个索引的加权系数,wi(H)表示关键词在第i个索引的得分,当所有αi为1时,上例最终得到的搜索结果H为{(B,0.6),(A,0.5),(C,0.4),(D,0.2)}。
在本发明实施例中,由于候选数据库中存储的匹配关键词的字面索引数量庞大,更新代价比较高,所以增加了快速更新数据库存储匹配关键词的更新索引,进行随时更新。对于候选数据库,可以设置比较长的更新周期,比如设置每天一次,对于快速更新数据库,可以设置比较短的更新周期,比如设置每半小时一次。无论是候选数据库,还是快速更新数据库,都是采用如图7所示的本发明实施例提供的更新方法流程图进行更新,其具体步骤为:
步骤701、判定是否满足设定条件,如果是,执行步骤702;否则,结束;
步骤702、为候选数据库或快速更新数据库中重新建立字面索引匹配关键词;
步骤703、将重新建立的字面索引匹配关键词加载到候选数据库或快速更新数据库中;
步骤704、将候选数据库或快速更新数据库中的匹配关键词的字面索引进行替换后,结束。
语义相关性数据库也可以更新,更新方式和图7的过程相似,只不过采用更新的是匹配关键词的语义索引。
可以看出,本发明实施例不仅搜索到了与关键词相匹配的字面索引,而且搜索到了与关键词相匹配的语义索引,提升了相关搜索结果的准确度;本发明实施例引入了快速更新数据库,避免单一的候选数据库更新字面索引缓慢问题,让快速更新数据库快速更新索引,有效提升相关搜索结果的时新性。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种相关搜索方法,其特征在于,该方法包括:
接收携带关键词的搜索请求,解析搜索请求得到关键词;
在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找与关键词匹配的语义索引得到语义搜索结果;
将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果;
该方法还包括:
在设置的快速更新数据库查找与关键词匹配的更新字面索引,根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
2.如权利要求1所述的方法,其特征在于,所述解析搜索请求得到关键词具体为:
采用反文档频率idf方式从搜索请求解析得到关键词。
3.如权利要求1所述的方法,其特征在于,所述根据字面相似度从匹配的字面索引中计算得到字面搜索结果具体为:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
4.一种相关搜索装置,其特征在于,包括:收发模块、解析模块、检索模块、字面相似度计算模块、语义相似度计算模块及融合模块,其中,
收发模块,用于接收携带关键词的搜索请求,发送从融合模块得到的最终匹配关键词的搜索结果;
解析模块,用于从搜索请求中解析关键词;
检索模块,用于在候选数据库中查找与关键词匹配的字面索引,在语义相关性数据库查找与关键词匹配的语义索引;
字面相似度计算模块,用于根据字面相似度从匹配的字面索引中计算得到字面搜索结果;
融合模块,用于将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果;
检索模块,还用于在快速更新数据库查找与关键词匹配的更新字面索引;
字面相似度计算模块,还用于根据字面相似度从匹配的更新字面索引中计算得到更新字面搜索结果;
融合模块,还用于在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
5.如权利要求4所述的装置,其特征在于,所述解析模块,具体用于:
采用反文档频率idf方式从搜索请求解析得到关键词。
6.如权利要求4或5所述的装置,其特征在于,所述字面相似度计算模块具体用于:
采用关键词权重加权方式对匹配的字面索引进行计算,得到字面搜索结果。
7.一种相关搜索系统,其特征在于,包括:客户端、搜索引擎、候选数据库及语义相关性数据库,其中,
客户端,用于向搜索引擎发送搜索请求,该搜索请求携带关键词,接收搜索引擎返回的搜索结果;
搜索引擎,用于接收搜索请求,解析搜索请求得到关键词,在候选数据库中查找与关键词匹配的字面索引并根据字面相似度从匹配的字面索引中计算得到字面搜索结果,在语义相关性数据库查找与关键词匹配的语义索引得到语义搜索结果,将字面搜索结果和语义搜索结果进行加权计算,得到最终匹配关键词的搜索结果,返回给客户端;
候选数据库,用于对应关键词存储字面索引;
语义相关性数据库,用于对应关键词存储语义索引;
所述系统还包括快速更新数据库,用于对应关键词存储更新字面索引;
所述搜索引擎,还用于在快速更新数据库查找与关键词匹配的更新字面索引,根据字面相似度计算从匹配的更新字面索引中得到更新字面搜索结果,在进行加权计算时,根据字面搜索结果、语义搜索结果和更新字面搜索结果,得到最终匹配关键词的搜索结果。
CN201210018974.3A 2012-01-20 2012-01-20 一种相关搜索系统、方法及装置 Active CN103218373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210018974.3A CN103218373B (zh) 2012-01-20 2012-01-20 一种相关搜索系统、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210018974.3A CN103218373B (zh) 2012-01-20 2012-01-20 一种相关搜索系统、方法及装置

Publications (2)

Publication Number Publication Date
CN103218373A CN103218373A (zh) 2013-07-24
CN103218373B true CN103218373B (zh) 2018-02-06

Family

ID=48816173

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210018974.3A Active CN103218373B (zh) 2012-01-20 2012-01-20 一种相关搜索系统、方法及装置

Country Status (1)

Country Link
CN (1) CN103218373B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995844B (zh) * 2014-05-06 2017-11-21 小米科技有限责任公司 信息搜索方法和装置
CN106326300A (zh) * 2015-07-02 2017-01-11 富士通株式会社 信息处理方法以及信息处理设备
CN105512334A (zh) * 2015-12-29 2016-04-20 成都陌云科技有限公司 基于搜索词的数据挖掘方法
CN105653671A (zh) * 2015-12-29 2016-06-08 畅捷通信息技术股份有限公司 相似信息推荐方法及系统
CN109376288B (zh) * 2018-09-28 2021-04-23 邦道科技有限公司 一种实现语义搜索的云计算平台及其均衡方法
CN111176650B (zh) * 2018-11-09 2023-04-18 阿里巴巴集团控股有限公司 解析器生成方法、检索方法、服务器及存储介质
CN110162522B (zh) * 2019-05-22 2023-04-07 武汉市公安局 一种分布式数据搜索系统及方法
CN110442673A (zh) * 2019-08-14 2019-11-12 黄河水利职业技术学院 中文文学用的信息查询系统及方法
CN110795607A (zh) * 2019-10-29 2020-02-14 中国人民解放军32181部队 一种基于多级相似度计算的装备保障数据匹配方法及系统
CN111008265B (zh) * 2019-12-03 2023-03-28 腾讯云计算(北京)有限责任公司 企业信息搜索方法及装置
CN115827990B (zh) * 2023-02-10 2023-11-21 北京中电普华信息技术有限公司 搜索方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271474A (zh) * 2007-03-20 2008-09-24 株式会社东芝 利用索引来搜索结构化文档的系统和方法
CN101539918A (zh) * 2008-03-19 2009-09-23 天下互联(北京)科技有限公司 一种互联网搜索方法及系统
CN101576901A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 搜索请求的产生方法及移动通信设备
CN102024041A (zh) * 2010-12-08 2011-04-20 王宝全 用于电子商务的搜索方法以及搜索系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9305089B2 (en) * 2009-12-08 2016-04-05 At&T Intellectual Property I, L.P. Search engine device and methods thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101271474A (zh) * 2007-03-20 2008-09-24 株式会社东芝 利用索引来搜索结构化文档的系统和方法
CN101539918A (zh) * 2008-03-19 2009-09-23 天下互联(北京)科技有限公司 一种互联网搜索方法及系统
CN101576901A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 搜索请求的产生方法及移动通信设备
CN102024041A (zh) * 2010-12-08 2011-04-20 王宝全 用于电子商务的搜索方法以及搜索系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于混合策略的中文查询串相似度计算";章成敏等;《情报杂志》;20051130(第11期);第101页左栏第1段-第103页右栏第2段 *

Also Published As

Publication number Publication date
CN103218373A (zh) 2013-07-24

Similar Documents

Publication Publication Date Title
CN103218373B (zh) 一种相关搜索系统、方法及装置
US9235638B2 (en) Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9792304B1 (en) Query by image
US8478704B2 (en) Decomposable ranking for efficient precomputing that selects preliminary ranking features comprising static ranking features and dynamic atom-isolated components
CN103377232A (zh) 标题关键词推荐方法及系统
US20150074076A1 (en) Search method, apparatus and system
US9971828B2 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
CN110019689A (zh) 职位匹配方法和职位匹配系统
US8566351B2 (en) System and program for generating boolean search formulas
US20070244862A1 (en) Systems and methods for ranking vertical domains
TW201317814A (zh) 搜索結果排序方法及設備、搜索方法及設備
CN110990533B (zh) 确定查询文本所对应标准文本的方法及装置
CN102163234A (zh) 一种基于纠错相关度对查询序列进行纠错的设备和方法
CN103838735A (zh) 一种提高检索效率和质量的数据检索方法
CN104636403B (zh) 处理查询请求的方法及装置
CN110688474A (zh) 基于深度学习与链接预测的嵌入表示获得及引文推荐方法
CN104778284A (zh) 一种空间图像查询方法和系统
US20080301111A1 (en) Method and system for providing ranked search results
US20150106376A1 (en) Document tagging and retrieval using entity specifiers
CN104281619A (zh) 搜索结果排序系统及方法
JP2004280569A (ja) 情報監視装置
CA2649534A1 (en) Systems and methods for performing searches within vertical domains
CN102651014B (zh) 基于概念关系的领域数据语义的检索方法
JP5315726B2 (ja) 情報提供方法、情報提供装置、および情報提供プログラム
CN105912649A (zh) 一种数据库模糊检索方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131030

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131030

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant