CN101149758A - 搜索系统及搜索方法 - Google Patents
搜索系统及搜索方法 Download PDFInfo
- Publication number
- CN101149758A CN101149758A CNA2007101815211A CN200710181521A CN101149758A CN 101149758 A CN101149758 A CN 101149758A CN A2007101815211 A CNA2007101815211 A CN A2007101815211A CN 200710181521 A CN200710181521 A CN 200710181521A CN 101149758 A CN101149758 A CN 101149758A
- Authority
- CN
- China
- Prior art keywords
- word
- module
- information
- search
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种搜索系统及搜索方法,其中,搜索系统包括:输入输出模块,连接到分词模块和查询模块,用于接收来自外部网络的用户的查询内容,以及将最终的查询结果返回给用户;分词模块,连接到输入输出模块,用于接收来自输入输出模块的用户的查询内容,并在对其进行分词、搜索、整合后,将关键词信息发送给输入输出模块;以及查询模块,连接到输入输出模块,用于将通过输入输出模块接收到的、来自分词模块的关键词信息在索引库中进行查询,然后将查询结果发送给输入输出模块,因此,采用本发明,用户可通过输入准确、简洁的关键字得到尽可能多的结果。
Description
技术领域
本发明涉及搜索引擎领域,尤其涉及一种在搜索引擎系统中实现关联搜索的系统及方法。
背景技术
搜索引擎系统是对不同格式、不同载体、不同来源的信息进行整合,将这些信息索引存储,并通过接收用户的查询指令向用户提供符合其查询要求的信息资源的系统。
搜索引擎系统需要为用户提供一个信息查询界面。现有的搜索引擎系统主要包括分类目录及关键词两种信息查询途径。分类目录查询是以资源结构为线索,将信息资源按照内容进行层次分类,使用户能依现行结构逐层逐类检索信息。并且,关键词查询是利用建立的索引库来向用户提供查询服务的。用户只要把想要查找的关键词或者短语输入查询词中,搜索引擎就会根据用户输入在索引库中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果。
但是,在上述几种方式都存在一些缺陷:
(1)利用信息资源进行层次分类的方式,如果分类较少,用户无法准确获取所需要的信息。如果分类较多,用户选择需要的分类信息要花费较多的时间。
(2)采取层次分类的方式,还对信息的整合要求较高。搜索引擎系统必须在进行信息收集、整合的时候提取信息的分类信息,这需要采取人工干预的方式,或者仅整合可靠信息来源的信息的方式来保障分类信息的准确度。
(3)采用用户输入关键字进行查询,搜索结果的质量同用户描述关系很大。如果用户输入越简洁、准确,那么得到的搜索结果的准确度越高。若用户输入不准确,则用户可能无法得到真正需要的信息,而且垃圾信息众多。
(4)用户有可能不确定自己到底想搜索的内容是什么,只有一个大致方向,这时不容易得到理想的搜索结果。
(5)用户若使用的查询词不妥当,容易造成垃圾结果众多。或者是使用的查询词较生僻,不能搜索到所需要的结果。
发明内容
鉴于上述问题,本发明目的在于提供一种根据用户的输入内容提取用户搜索关键词,根据该关键词进行扩展并进行相关搜索以达到最大限度的利用用户关键词得到用户所需要信息的搜索系统及搜索方法。
根据本发明的一个方面,提供了一种搜索系统,其包括:输入输出模块,连接到分词模块和查询模块,用于接收来自外部网络的用户的查询内容,以及将最终的查询结果返回给用户;分词模块,连接到输入输出模块,用于接收来自输入输出模块的用户的查询内容,并在对其进行分词、搜索、整合后,将关键词信息发送给输入输出模块;以及查询模块,连接到输入输出模块,用于将通过输入输出模块接收到的、来自分词模块的关键词信息在索引库中进行索引,然后将查询结果发送给输入输出模块。
此外,本发明的搜索系统还包括:关联索引维护模块,用于维护所述关联词信息搜索时所需的关联词索引库。
其中,在上述分词模块中包括:中文分词模块,用于根据不同的分词方法对用户的查询内容进行分词,并输出分词信息给整合模块;关联搜索处理模块,用于接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给整合模块;以及整合模块,用于将作为分词结果的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
并且,在查询模块中包括:索引模块,用于对需要搜索的内容建立索引库,对索引进行维护,并当源信息更新时,同步更新索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
根据本发明的另一方面,提供了一种搜索方法,其包括:步骤一,用户通过外部网络与输入输出模块交互,向输入输出模块提交查询内容;步骤二,输入输出模块接收查询内容,并发送给分词模块,分词模块对查询内容进行分词、搜索、整合后发送关键词信息给输入输出模块;步骤三,输入输出模块将关键词信息发送给查询模块,查询模块在索引库中对关键词信息进行索引,并将查询结果发送给输入输出模块;步骤四,输入输出模块将查询结果进行调整后返回给用户。
在上述的搜索方法中,还包括:由关联索引维护模块维护所述关联词信息搜索时所需的关联词索引库。
并且,在步骤二中还包括以下步骤:根据不同的分词方法由中文分词模块对用户的查询内容进行分词,并输出分词信息给分词模块;由关联搜索处理模块接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给分词模块;以及通过整合模块将作为分词结果的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
此外,在上述步骤三中还包括:由索引模块对需要搜索的内容建立所述索引库,对索引进行维护,并当源信息更新时,同步更新所述索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
因此,通过本发明,用户可通过输入准确、简洁的关键字得到尽可能多的结果,同时,也可通过输入关注的关键字得到潜在相关的搜索结果,比如,搜索重庆小吃,可能得到重庆火锅的相关信息等。并且,当用户输入的信息不准确时,系统可以通过该词的关联搜索,进行自动纠正,并得到正确的搜索结果。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据本发明的搜索系统的构成的框图;
图2是根据本发明的搜索方法的流程图;
图3是根据本发明实施例的搜索系统的结构框图;
图4是图3的搜索系统中各组成模块的具体结构框图;以及
图5是根据本发明实施例的搜索方法的流程图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1是根据本发明的搜索系统的构成的框图。
如图1所示,根据本发明的搜索系统,其包括:输入输出模块102,连接到分词模块104和查询模块106,用于接收来自外部网络的用户的查询内容,以及将最终的查询结果返回给用户;分词模块104,连接到输入输出模块102,用于接收来自输入输出模块102的用户的查询内容,并在对其进行分词、搜索、整合后,将关键词信息发送给输入输出模块102;以及查询模块104,连接到输入输出模块102,用于将通过输入输出模块102接收到的、来自分词模块104的关键词信息在索引库中进行索引,然后将查询结果发送给输入输出模块102。
此外,本发明的搜索系统还包括:关联索引维护模块,用于维护所述关联词信息搜索时所需的关联词索引库。
其中,在上述分词模块104中包括:中文分词模块,用于根据不同的分词方法对用户的查询内容进行分词,并输出分词信息给整合模块;关联搜索处理模块,用于接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给整合模块;以及整合模块,用于将作为分词结果的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
并且,在上述查询模块106中包括:索引模块,用于对需要搜索的内容建立索引库,对索引进行维护,并当源信息更新时,同步更新索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
具体而言,利用本发明的搜索系统和搜索方法,搜索引擎在对用户的输入进行分析的时候,可以对用户输入的关键词进行诸如同义词、近义词、相关词等进行处理,自动对用户输入的内容扩展多个同义词或者近义词或者相关词,并在另用这些词在搜索引擎系统的索引库中进行扩展搜索,返回用户查询结果,对用户的扩展搜索进行提示。通过上述系统,用户可以快捷方便的搜索到自己需要的信息,同时降低了搜索引擎对使用者的门槛。通过该系统,用户可以得到尽可能多的感兴趣的信息。
图3是根据本发明实施例的搜索系统的结构框图,图4是图3的搜索系统中各组成模块的具体结构框图。
如图3及图4所示,本发明实施例的搜索系统包括:输入输出模块302、分词模块304、中文分词模块3042、关联搜索处理模块3044、整合模块3046、关联索引维护模块、查询模块306、以及索引模块3062。
本发明所述的搜索系统各组成部分的功能及连接关系如下:
输入输出模块302,通过与外部系统的交互完成对用户输入内容的接收,并将接收到的文字内容发送给分词模块304。接收从分词模块304返回的分词信息,并将分词结果作为关键字进行搜索。
分词模块304,调用中文分词模块3042得到初步的分词结果,并将初步分词结果发送给在关联搜索处理模块3044,接受从该关联搜索处理模块3044返回的关联词信息。并通过整合模块3046将关联词信息与其他分词信息整合后,一同返回给输入输出模块302。
中文分词模块3042,根据不同的分词方法,对用户的输入信息进行切分。
关联搜索处理模块3044,接受来自分词模块304的文字信息,利用文字信息在关联词索引库内进行搜索,并将得到的关联词信息返回给整合模块3046。
关联索引维护模块,维护关联词搜索所需的关联词索引库。在关联词索引库中,维护关键词的相关搜索关键词的信息。相关的搜索的关键词可以是该关键词的同义词、同音词、近义词或者是其他相关的搜索词。
查询模块306,接受输入输出模块302的关键字,并根据关键字形成查询条件对索引文件进行查询。得到匹配用户查询要求的结果,并将查询结果返回给用户。
索引模块3062,用于维护全文索引。索引模块3062通过扫描需要搜索的信息中的每一个词,对每一个词建立索引,指明该词在文章中出现的次数和位置。
其中,输入输出模块302完成接收用户的输入。用户通过外部网络与输入输出模块进行交互。外部网络包括IP网络、WAP网络等多种网络,通过HTTP、TCP/IP等协议接入关联搜索系统。
分词模块304的查找算法可采用机械分词法中的最大左匹配法的方式对用户输入进行分词操作。将匹配上字典条目分词结果标识上需要进行关联查找。
关联搜索处理模块3044利用从分词模块304中得到的分词信息为最小查找单位,在关联词的索引库内进行快速查询,并得到分词信息的关联词信息。
此外,利用关联索引维护模块形成关联词索引库,该关联词索引库中的一个词条可对应多个词语,每个词语有对应的词频、关联词的类别(可包含同义词、同音词、近义词、关联词等类别)。
索引模块3062通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,查询模块306就根据事先建立的索引进行查询,并将查找的结果发送给输入输出模块302,从而反馈给用户。
下面,参照图2对本发明涉及的搜索方法进行说明。图2是根据本发明的搜索方法的流程图。
如图2所示,根据本发明的搜索方法,其包括:步骤S02,用户通过外部网络与输入输出模块交互,向输入输出模块提交查询内容;步骤S204,输入输出模块接收查询内容,并发送给分词模块,分词模块对查询内容进行分词、搜索、整合后发送关键词信息给输入输出模块;步骤S206,输入输出模块将关键词信息发送给查询模块,查询模块在索引库中对关键词信息进行索引,并将查询结果发送给输入输出模块;步骤S208,输入输出模块将查询结果进行调整后返回给用户。
在上述的搜索方法中,还包括:由关联索引维护模块维护所述关联词信息搜索时所需的关联词索引库。
并且,在步骤S204中还包括以下步骤:根据不同的分词方法由中文分词模块对用户的查询内容进行分词,并输出分词信息给分词模块;由关联搜索处理模块接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给分词模块;以及通过整合模块将作为分词结果的的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
此外,在上述步骤S206中还包括:由索引模块对需要搜索的内容建立所述索引库,对索引进行维护,并当源信息更新时,同步更新所述索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
具体而言,上述搜索方法包括:
(1)用户与输入输出模块交互,向输入输出模块提交查询串;
(2)输入输出模块将查询串发送给分词模块,分词模块调用中文分词模块根据不同的分词策略对用户的查询串进行分词;
(3)分词模块的整合模块接收中文分词模块的分词结果,则将该信息发送给关联搜索处理模块;
(4)关联搜索处理模块接受从分词模块的文字信息,利用文字信息在关联词索引库内进行搜索,并将得到的关联词信息返回给整合模块;
(5)分词模块的整合模块整合从关联搜索处理模块返回的信息与其他分词所得的关键词信息,作为搜索的关键词返回给输入输出模块;
(6)输入输出模块将关键词发送给查询模块。
(7)查询模块利用得到的关键词对索引库进行查找,并将索引库中匹配的信息返回给输入输出模块。由输入输出模块对结果进行调整,返回给用户;
(8)后台处理:系统利用索引模块对需要搜索的资料建立索引,对索引进行维护,当源信息更新时,同步更新索引库信息。
下面,参照图5对本发明实施例涉及的搜索方法进行说明。
如图5所示,该关联搜索方法包括以下步骤:步骤S502,接收用户欲查询的查询串;步骤S504,对查询串进行初步分词,步骤S506,对初步分词结果在关联词索引库内进行搜索,得到最终分词结果;以及步骤S508,根据经过处理的最终分词结果进行数据查询。
其中,在步骤S506中,还对关联词建立索引库,并对关联词索引进行维护。在步骤S508中,还对需要查询的资料建立索引库,并对索引进行维护。
综上所述,通过本发明,用户可通过输入准确、简洁的关键字得到尽可能多的结果,同时,也可通过输入关注的关键字得到潜在相关的搜索结果,比如,搜索重庆小吃,可能得到重庆火锅的相关信息等。并且,当用户输入的信息不准确时,系统可以通过该词的关联搜索,进行自动纠正,并得到正确的搜索结果。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种搜索系统,其特征在于,包括:
输入输出模块,连接到分词模块和查询模块,用于接收来自外部网络的用户的查询内容,以及将最终的查询结果返回给所述用户;
所述分词模块,连接到所述输入输出模块,用于接收来自所述输入输出模块的所述用户的查询内容,并在对其进行分词、搜索、整合后,将关键词信息发送给所述输入输出模块;
以及
所述查询模块,连接到所述输入输出模块,用于将通过所述输入输出模块接收到的、来自所述分词模块的所述关键词信息在索引库中进行索引,然后将所述查询结果发送给所述输入输出模块。
2.根据权利要求1所述的搜索系统,其特征在于,还包括:
关联索引维护模块,用于维护所述关联词信息搜索时所需的关联词索引库。
3.根据权利要求1或2所述的搜索系统,其特征在于,在所述分词模块中包括:
中文分词模块,用于根据不同的分词方法对所述用户的查询内容进行分词,并输出分词信息给整合模块;
关联搜索处理模块,用于接收所述分词模块的所述分词信息,利用所述分词信息在所述关联词索引库中进行搜索,并输出所述关联词信息给所述整合模块;以及
所述整合模块,用于将作为分词结果的所述分词信息、和作为搜索结果的所述关联词信息整合为所述关键词信息。
4.根据权利要求1或2所述的搜索系统,其特征在于,在所述查询模块中包括:
索引模块,用于对需要搜索的内容建立所述索引库,对索引进行维护,并当源信息更新时,同步更新所述索引库的信息。
5.根据权利要求1所述的搜索系统,其特征在于,
所述分词方法包括机械分词法中的最大左匹配法。
6.一种搜索方法,其特征在于,包括:
步骤一,用户通过外部网络与输入输出模块交互,向所述输入输出模块提交查询内容;
步骤二,所述输入输出模块接收所述查询内容,并发送给分词模块,所述分词模块对所述查询内容进行分词、搜索、整合后发送关键词信息给所述输入输出模块;
步骤三,所述输入输出模块将所述关键词信息发送给所述查询模块,所述查询模块在所述索引库中对所述关键词信息进行索引,并将查询结果发送给所述输入输出模块;以及
步骤四,所述输入输出模块将所述查询结果进行调整后返回给所述用户。
7.根据权利要求6所述的搜索方法,其特征在于,还包括:
由关联索引维护模块维护所述关联词信息搜索时所需的关联词索引库。
8.根据权利要求6或7所述的搜索方法,其特征在于,在步骤二中还包括以下步骤:
根据不同的分词方法由中文分词模块对所述用户的查询内容进行分词,并输出分词信息给所述分词模块;
由关联搜索处理模块接收所述分词模块的所述分词信息,利用所述分词信息在所述关联词索引库中进行搜索,并输出所述关联词信息给所述分词模块;以及
通过整合模块将作为分词结果的所述分词信息、和作为搜索结果的所述关联词信息整合为所述关键词信息。
9.根据权利要求6或7所述的搜索方法,其特征在于,在所述步骤三中还包括:
由索引模块对需要搜索的内容建立所述索引库,对索引进行维护,并当源信息更新时,同步更新所述索引库的信息。
10.根据权利要求6所述的搜索方法,其特征在于,
所述分词方法包括机械分词法中的最大左匹配法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101815211A CN101149758A (zh) | 2007-10-18 | 2007-10-18 | 搜索系统及搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101815211A CN101149758A (zh) | 2007-10-18 | 2007-10-18 | 搜索系统及搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101149758A true CN101149758A (zh) | 2008-03-26 |
Family
ID=39250284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101815211A Pending CN101149758A (zh) | 2007-10-18 | 2007-10-18 | 搜索系统及搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101149758A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102231147A (zh) * | 2010-11-08 | 2011-11-02 | 百度在线网络技术(北京)有限公司 | 一种用于实时展现联想词的方法、设备及系统 |
CN102385577A (zh) * | 2010-08-27 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 搜索方法和系统 |
CN102479193A (zh) * | 2010-11-22 | 2012-05-30 | 百度在线网络技术(北京)有限公司 | 一种基于匹配出价系数进行匹配搜索推广的方法和设备 |
CN102486784A (zh) * | 2010-12-06 | 2012-06-06 | 耶宝智慧(北京)技术发展有限公司 | 信息请求方法和信息提供方法 |
CN102508884A (zh) * | 2011-10-18 | 2012-06-20 | 盘古文化传播有限公司 | 热点事件与实时评论的获取方法及装置 |
CN102779163A (zh) * | 2012-06-18 | 2012-11-14 | 青岛禧泰房产数据技术有限公司 | 量化检索方法及量化检索系统 |
CN102999569A (zh) * | 2012-11-09 | 2013-03-27 | 同济大学 | 用户需求分析定位器和分析及定位方法 |
CN103020070A (zh) * | 2011-09-22 | 2013-04-03 | 联想(北京)有限公司 | 搜索方法和电子终端 |
CN103412899A (zh) * | 2013-07-26 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 搜索方法和搜索引擎 |
CN103631784A (zh) * | 2012-08-21 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 页面内容检索方法和系统 |
CN104090875A (zh) * | 2013-04-01 | 2014-10-08 | 鸿富锦精密工业(深圳)有限公司 | 信息检索系统及方法 |
CN104462552A (zh) * | 2014-12-25 | 2015-03-25 | 北京奇虎科技有限公司 | 问答页面核心词提取方法和装置 |
CN104537101A (zh) * | 2015-01-12 | 2015-04-22 | 杏树林信息技术(北京)有限公司 | 医学信息搜索引擎系统和搜索方法 |
CN108446965A (zh) * | 2018-04-09 | 2018-08-24 | 广州腾骋飞贸易有限公司 | 一种商品在线贸易交易系统 |
CN109063060A (zh) * | 2018-07-20 | 2018-12-21 | 吴怡 | 一种语义网法律咨询服务机器人 |
CN109753553A (zh) * | 2018-12-03 | 2019-05-14 | 广东工业大学 | 自然语言的处理系统及方法 |
CN111833118A (zh) * | 2019-04-10 | 2020-10-27 | 拉扎斯网络科技(上海)有限公司 | 商户信息确定方法、装置、电子设备和非易失性存储介质 |
CN113065340A (zh) * | 2021-03-11 | 2021-07-02 | 国网河北省电力有限公司 | 基于相近词挖掘的相近资产提示方法及装置 |
-
2007
- 2007-10-18 CN CNA2007101815211A patent/CN101149758A/zh active Pending
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385577A (zh) * | 2010-08-27 | 2012-03-21 | 腾讯科技(深圳)有限公司 | 搜索方法和系统 |
CN102231147A (zh) * | 2010-11-08 | 2011-11-02 | 百度在线网络技术(北京)有限公司 | 一种用于实时展现联想词的方法、设备及系统 |
CN102479193A (zh) * | 2010-11-22 | 2012-05-30 | 百度在线网络技术(北京)有限公司 | 一种基于匹配出价系数进行匹配搜索推广的方法和设备 |
CN102486784A (zh) * | 2010-12-06 | 2012-06-06 | 耶宝智慧(北京)技术发展有限公司 | 信息请求方法和信息提供方法 |
CN102486784B (zh) * | 2010-12-06 | 2014-08-06 | 尹红伟 | 信息请求方法和信息提供方法 |
CN103020070B (zh) * | 2011-09-22 | 2016-03-30 | 联想(北京)有限公司 | 搜索方法和电子终端 |
CN103020070A (zh) * | 2011-09-22 | 2013-04-03 | 联想(北京)有限公司 | 搜索方法和电子终端 |
CN102508884A (zh) * | 2011-10-18 | 2012-06-20 | 盘古文化传播有限公司 | 热点事件与实时评论的获取方法及装置 |
CN102779163A (zh) * | 2012-06-18 | 2012-11-14 | 青岛禧泰房产数据技术有限公司 | 量化检索方法及量化检索系统 |
CN103631784B (zh) * | 2012-08-21 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 页面内容检索方法和系统 |
CN103631784A (zh) * | 2012-08-21 | 2014-03-12 | 腾讯科技(深圳)有限公司 | 页面内容检索方法和系统 |
CN102999569A (zh) * | 2012-11-09 | 2013-03-27 | 同济大学 | 用户需求分析定位器和分析及定位方法 |
CN102999569B (zh) * | 2012-11-09 | 2015-08-19 | 同济大学 | 用户需求分析定位器和分析及定位方法 |
CN104090875A (zh) * | 2013-04-01 | 2014-10-08 | 鸿富锦精密工业(深圳)有限公司 | 信息检索系统及方法 |
CN103412899B (zh) * | 2013-07-26 | 2016-02-10 | 百度在线网络技术(北京)有限公司 | 搜索方法和搜索引擎 |
CN103412899A (zh) * | 2013-07-26 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 搜索方法和搜索引擎 |
CN104462552A (zh) * | 2014-12-25 | 2015-03-25 | 北京奇虎科技有限公司 | 问答页面核心词提取方法和装置 |
CN104462552B (zh) * | 2014-12-25 | 2018-07-17 | 北京奇虎科技有限公司 | 问答页面核心词提取方法和装置 |
CN104537101A (zh) * | 2015-01-12 | 2015-04-22 | 杏树林信息技术(北京)有限公司 | 医学信息搜索引擎系统和搜索方法 |
CN108446965A (zh) * | 2018-04-09 | 2018-08-24 | 广州腾骋飞贸易有限公司 | 一种商品在线贸易交易系统 |
CN109063060A (zh) * | 2018-07-20 | 2018-12-21 | 吴怡 | 一种语义网法律咨询服务机器人 |
CN109753553A (zh) * | 2018-12-03 | 2019-05-14 | 广东工业大学 | 自然语言的处理系统及方法 |
CN111833118A (zh) * | 2019-04-10 | 2020-10-27 | 拉扎斯网络科技(上海)有限公司 | 商户信息确定方法、装置、电子设备和非易失性存储介质 |
CN113065340A (zh) * | 2021-03-11 | 2021-07-02 | 国网河北省电力有限公司 | 基于相近词挖掘的相近资产提示方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101149758A (zh) | 搜索系统及搜索方法 | |
CN107729336B (zh) | 数据处理方法、设备及系统 | |
US20180032930A1 (en) | System and method to Generate Queries for a Business Database | |
CN101408876B (zh) | 一种电子文档全文检索的方法及系统 | |
US8554854B2 (en) | Systems and methods for identifying terms relevant to web pages using social network messages | |
CN100514337C (zh) | 关键词的联想信息生成系统和生成方法 | |
US10445359B2 (en) | Method and system for classifying media content | |
US8126897B2 (en) | Unified inverted index for video passage retrieval | |
CN102043833B (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
KR20200067180A (ko) | 대형 데이터베이스들에서의 시맨틱 검색을 위한 방법들 및 시스템 | |
CN102479191A (zh) | 提供多粒度分词结果的方法及其装置 | |
WO2007008263A2 (en) | Self-organized concept search and data storage method | |
JP6355840B2 (ja) | ストップワード識別方法および装置 | |
CN103198067A (zh) | 一种业务搜索方法及系统 | |
CN101082936A (zh) | 数据查询系统及方法 | |
WO2002027563A1 (en) | Method and system for query reformation | |
CN114218400A (zh) | 基于语义的数据湖查询系统及方法 | |
CN103218373A (zh) | 一种相关搜索系统、方法及装置 | |
Elshater et al. | godiscovery: Web service discovery made efficient | |
CN115563313A (zh) | 基于知识图谱的文献书籍语义检索系统 | |
CN102314464B (zh) | 歌词搜索方法及搜索引擎 | |
CN103198066A (zh) | 一种基于词表的信息搜索方法及搜索系统 | |
CN103226601A (zh) | 一种图片搜索的方法和装置 | |
CN117874166A (zh) | 文本处理方法、装置、计算机设备及存储介质 | |
CN111324705A (zh) | 自适应性调整关连搜索词的系统及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |