CN101847161A - 搜索网页的方法和建立数据库的方法 - Google Patents
搜索网页的方法和建立数据库的方法 Download PDFInfo
- Publication number
- CN101847161A CN101847161A CN201010189350A CN201010189350A CN101847161A CN 101847161 A CN101847161 A CN 101847161A CN 201010189350 A CN201010189350 A CN 201010189350A CN 201010189350 A CN201010189350 A CN 201010189350A CN 101847161 A CN101847161 A CN 101847161A
- Authority
- CN
- China
- Prior art keywords
- search
- information
- commodity
- picture
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于搜索引擎领域,特别是涉及搜索网页的方法和建立数据库的方法及其在商品搜索中的应用。利用能够从互联网上自动收集网页的蜘蛛程序从互联网提取各个网站的信息,包括网页文字、图片、视频、音声等建立数据库。在完成根据用户搜索条件进行第一轮搜索后,从与用户搜索条件匹配最好或满足其他条件下的每个行数据中选择一个或多个新的信息数据作为新的搜索条件进行下一轮搜索。重复此过程直至搜索完成后按一定的排列顺序返回结果。也可以用上述方法在原来的索引数据库中加入分类重组索引数据库。这样有助于挖掘更深层的相关信息。本发明可以广泛应用于互联网搜索、移动终端搜索等领域,尤其适用于网上购物的商品搜索等领域。
Description
技术领域
本发明属于搜索引擎领域,特别是涉及利用基于内容的多媒体搜索技术和基于关键词的文本搜索技术以及它们的组合技术进行搜索网页的方法和建立数据库的方法及其在商品搜索中的应用。
背景技术
单纯基于文本使用关键词从互联网中搜索网页信息、图片、视频、音乐等的著名搜索引擎有百度、谷歌、必应和雅虎等。但是它们的索引数据库通常只包括网页地址(URL)、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等。而且搜索条件一般也只限于关键词。
发明内容
本发明所要解决的技术问题是更深层次的信息搜索。本发明为了解决上述技术问题所采用的技术方案之一是:建立包含网页基本信息、图片、视频、音声等信息的多维信息索引数据库。其中网页基本信息包括网页地址(URL)、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等。图片、视频、音声等信息则包括从网页中的图片、视频、音声等信息中提取的特征值,譬如图像的颜色、形状、纹理、空间关系等特征值、以及生成时间、大小、标注、格式等。搜索时,以计算机、手机等输入设备取得一个或多个搜索条件,系统根据需要进行特征值抽取等处理后由搜索系统程序从上述多维信息索引数据库中找到相关数据,实现第一轮对多维索引数据库的搜索。之后系统从上述搜索结果中指定一个或多个,譬如从匹配度最高的一个多维数据中选择一个或多个其他信息作为新的搜索条件进行下一轮搜索。重复此过程直至搜索完成后由页面生成系统将搜索结果的链接地址和页面内容摘要、图片等内容组织起来按一定排列顺序返回给用户。
本发明为了解决上述技术问题所采用的技术方案之二是:对上述多维信息索引数据库按以下方法重新组织,建立新的索引数据库,以增加搜索范围和提高搜索速度。首先在索引数据库中的任意一个索引行数据中选择一个或多个索引数据以外的列数据作为搜索条件在上述多维信息索引数据库中搜索具有相同或相似列的行数据,并将其归为同类或相似类建立索引数据库,然后依次在这些行数据中选择另一个或多个其他数据作为新的搜索条件,重复以上过程直至新的索引数据库建成。这样对具有上述索引数据库结构的网页索引数据库进行搜索时,搜索条件符合同类或相似列数据中任意一条或多条都可以视为符合此搜索条件,页面生成系统将搜索结果的链接地址和页面内容摘要、图片等内容组织起来按一定排列顺序返回给用户。
具体实施方式
下面首先从搜索过程来阐述本发明的技术方案的具体实施方式,然后以商品搜索为实施例对本发明进一步说明。
本发明的网页搜索的步骤主要包括:
(1)从互联网抓取网页。利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有网页地址(URL)爬到其他网页,重复此过程,并把爬过的所有网页收集到服务器中。
(2)建立索引数据库。由索引系统程序对收集回来的网页进行分析,提取相关网页基本信息(包括网页地址(URL)、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等)。同时对网页里可能存在的图片、视频、音声等信息进行特征值抽取处理,提取相关的特征值信息(譬如图片的颜色、形状、纹理、空间关系等),以及生成时间、大小、标注、格式等。根据一定的相关度算法进行计算,得到每一个网页针对页面内容中及超链中每一个关键词、特征值的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
(3)在索引数据库中搜索。当用户输入搜索条件,譬如:关键词、图片、视频、音声等信息或它们的特征值请求搜索后,如果是图片、视频、音声等信息则进行特征值抽取后,分解搜索请求,由搜索系统从网页索引数据库中找到符合该搜索条件的所有相关网页。
(4)对搜索结果进行排序。所有相关网页针对该搜索条件的相关信息在索引库中都有记录,只需综合相关信息和网页级别形成相关度数值,然后进行排序,相关度越高,排序越靠前。
(5)根据搜索结果请求二次搜索。对(4)的搜索结果进行分析,如果需要,对排名最前或排名前几位的网页的索引数据中其他一个或多个列数据作为新的搜索条件返回(3)请求新的一轮搜索。当然新的搜索条件可以是事先指定的也可以提示给用户由用户选择。
如果不需要则进入(6)。
(6)组织结果返回给用户。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
本发明的基于索引数据库分类的搜索方法的步骤主要包括:
(1)从互联网抓取网页。利用能够从互联网上自动收集网页的网络蜘蛛程序,自动访问互联网,并沿着任何网页中的所有网页地址(URL)爬到其他网页,重复此过程,并把爬过的所有网页收集到服务器中。
(2)建立索引数据库。由索引系统程序对收集回来的网页进行分析,提取相关网页基本信息(包括网页地址(URL)、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等)。同时对网页里可能存在的图片、视频、音声等信息进行特征值抽取处理,提取相关的特征值信息(譬如图片的颜色、形状、纹理、空间关系等),以及生成时间、大小、标注、格式等。根据一定的相关度算法进行计算,得到每一个网页针对页面内容中及超链中每一个关键词、特征值的相关度(或重要性),然后用这些相关信息建立网页索引数据库。
(3)建立包括分类的新索引数据库。在上述关键词、特征值等中选择一个或几个列数据作为搜索条件在上述网页索引数据库中搜索具有相同或相似列数据的行数据,并从中选择一个或几个数据列使其具有和搜索条件相同或相似的索引功能,并根据一定的相关度算法进行计算,给出它们的相关度(或重要性)。重复以上过程以建立新的索引数据库。也就是说以后凡是以上述搜索条件进行搜索时,不仅可以搜到原索引数据库的数据,还可以搜到新追加的索引数据。
(4)在新索引数据库中搜索。当用户输入搜索条件,譬如:关键词、图片、视频、音声等信息或它们的特征值请求搜索后,如果是图片、视频、音声等信息则进行特征值抽取后,分解搜索请求,由搜索系统从新网页索引数据库中找到符合该搜索条件的所有相关网页。
(5)对搜索结果进行排序。所有相关网页针对该搜索条件的相关信息在索引库中都有记录,只需综合相关信息和网页级别形成相关度数值,然后进行排序,相关度越高,排序越靠前。
(6)组织结果返回给用户。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
下面以商品搜索为实施例对本发明进一步说明。
本发明用于商品搜索时具体搜索的步骤主要包括:
(1)从互联网抓取购物网站网页。利用能够从互联网上自动收集网页的网页蜘蛛程序,自动访问分布在网络上的购物网站,并把所有网页收集到服务器中
(2)建立商品索引数据库。由索引系统程序对收集回来的网页进行分析,提取每个商品的网页基本信息,包括网页地址(URL)、编码类型、商品名、型号、商家名、商品简介、价格以及生成时间、大小和与其他网页的链接关系等。同时对网页里的商品图片进行特征值抽取处理,提取图片的颜色、形状、纹理等特征值,以及生成时间、大小、标注、格式等。根据一定的相关度算法进行计算,得到每一个商品针对每一个关键词(譬如商品名、型号、商家名、商品简介、价格等)、特征值(譬如图片的颜色、形状、纹理等)的相关度(或重要度),然后用这些相关信息建立商品网页索引数据库。
(3)在商品索引数据库中搜索。当用户输入搜索条件,譬如关键词或图片或两者的组合,请求搜索后,如果需要则抽取图片特征值,分解搜索请求,由搜索系统从商品数据库中找到符合该搜索条件的所有相关商品。
(4)对搜索结果进行排序。所有相关商品针对该搜索条件的相关信息在索引库中都有记录,只需综合相关信息和商品级别形成相关度数值,然后进行排序,相关度越高,排名越靠前。
(5)根据搜索结果,请求二次搜索。对(4)的搜索结果进行分析,如果需要,对排名最前或排名前几位的商品的索引数据中其他一个或多个列数据作为新的搜索条件返回(3)请求下一轮搜索。譬如对尚未作为搜索条件的商品型号、图片及相关图片等作为新的搜索条件返回(3)请求下一轮搜索。这样如果用户输入的搜索条件是商品图片,第一轮搜索即可以搜索到使用同一商品图片或相似商品图片的所有商品信息。如果这些商品信息中包括不同的商品图片,由此进行二次搜索可以获得使用该图片的商品信息。同时从上述图片搜索的结果里还可以获得诸如商品型号、名称、商家名等信息,由此进行关键词搜索可以获得所有使用同一商品型号的商品信息,包括商品图片信息等。而这些商品图片信息又可以作为下一轮搜索的条件。重复上述搜索直至满足搜索要求。这样可以搜索到不同网站、不同店铺的同一商品或相似商品,即使它们使用不同的商品名、不同的商品图片、不同的型号。
如果不需要,则进入(6)。
(6)组织结果返回给用户。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户
本发明的基于索引数据库分类的商品搜索方法的步骤主要包括:
(1)从互联网抓取购物网站网页。利用能够从互联网上自动收集网页的网页蜘蛛程序,自动访问分布在网络上的购物网站,并把所有网页收集到服务器中
(2)建立商品索引数据库。由索引系统程序对收集回来的网页进行分析,提取每个商品的网页基本信息,包括网页地址(URL)、编码类型、商品名、型号、商家名、商品简介、价格以及生成时间、大小和与其他网页的链接关系等。同时对网页里的商品图片进行特征值抽取处理,提取图片的颜色、形状、纹理等特征值,以及生成时间、大小、标注、格式等。根据一定的相关度算法进行计算,得到每一个商品针对每一个关键词(譬如商品名、型号、商家名、商品简介、价格等)、特征值(譬如图片的颜色、形状、纹理等)的相关度(或重要度),然后用这些相关信息建立商品网页索引数据库。
(3)建立包括分类的新商品索引数据库。在上述关键词、特征值等中选择一个或几个数据搜索条件在上述网页索引数据库中搜索具有相同或相似列数据的行数据,从中选择一个或几个列数据使其具有和搜索条件相同或相似的索引功能,并根据一定的相关度算法进行计算,给出它们的相关度(或重要性)。重复以上过程以建立新的索引数据库。譬如对于索引中的商品型号,首先搜索相同或相似的商品型号的行数据,然后用这些行数据中的一张或几张图片搜索相同或相似的行数据。如果符合一定条件,这些行数据的商品型号如果使用不同名称等,则使其具有和原索引相同或相似的索引功能;对于商品图片索引也一样,首先搜索相同或相似的商品图片的行数据,然后用这些行数据中的一个或多个商品型号搜索具有相同或相似列数据的行数据。如果符合一定条件,这些行数据的商品图片如果使用不同商品图片等,则可使这些新的商品图片等具有和原索引相同或相似的索引功能。然后根据一定的相关度算法进行计算,给出它们的相关度(或重要性)。重复以上过程以建立新的商品索引数据库。这样以后凡是以上述搜索条件进行搜索时,不仅可以搜到原索引数据库的数据,还可以搜到新追加的索引数据。
(4)在新商品索引数据库中搜索。当用户输入搜索条件,譬如关键词或图片或两者的组合,请求搜索后,如果需要则抽取图片特征值,分解搜索请求,由搜索系统从商品数据库中找到符合该搜索条件的所有相关商品。
(4)对搜索结果进行排序。所有相关商品针对该搜索条件的相关信息在索引库中都有记录,只需综合相关信息和商品级别形成相关度数值,然后进行排序,相关度越高,排名越靠前。
(5)组织结果返回给用户。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户
上述基于内容的多媒体搜索技术和基于关键词文本搜索技术和它们的组合技术进行搜索网页的方法和建立数据库的方法可以用于挖掘更深层次的数据,提高搜索精度和增加搜索范围。特别是用于商品搜索时,本发明可以搜索到不同网站、不同店铺的同一商品或相似商品,即使它们使用不同的商品名、不同的商品图片、不同的型号,还可以搜索类似商品的信息,实现真正的商品全网搜索。
Claims (9)
1.一种网页的搜索方法,其特征在于把网站的信息,网页基本信息、图片、视频、音声等信息,其中网页基本信息包括网页所在URL、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等,图片、视频、音声等信息则包括从图片、视频、音声等信息中提取的特征值,如图像的颜色、形状、纹理、空间关系等,建立多维信息索引数据库,然后在多维信息数据空间中由搜索系统程序从多维信息索引数据中找到完全符合用户搜索条件、或计算用户搜索条件与目标数据之间的相似程度,实现第一轮对多维数据的搜索,之后从上述搜索结果中指定一个或多个,譬如匹配度最高的一个多维行数据中选择一个或多个其他信息数据作为新的搜索条件进行下一轮搜索,重复此过程直至搜索完成后按一定的排列顺序向用户返回结果。
2.根据权利要求1所述的搜索方法,其特征是多维行数据中的图片、视频或音声等信息包括他们的生成时间、大小、格式、标注等,以及从图片、视频或音声等提取的特征值。
3.根据权利要求1所述的搜索方法,其特征是所有搜索条件可以是文字也可以是图片、视频或音声等任何数据。
4.根据权利要求1所述的搜索方法,其特征是所有搜索条件可以是图片、视频或音声等,也可以是从图片、视频或音声等提取的特征值。
5.根据权利要求1所述的搜索方法,其特征是所有搜索条件可以是一个数据或特征值数据,也可以是多个的任意组合。
6.根据权利要求1所述的搜索方法,其特征是新一轮的搜索可以是自动的也可以提示给用户选择决定。
7.根据权利要求1所述的搜索方法应用于商品搜索时,商品的多维信息索引数据可包括商品名、分类、型号、尺寸、图案、样式、板型、适合人群、材质、名称、价格,商家名、简要说明、链接等网页信息和商品图片的颜色、形状、纹理等特征信息,搜索时可以从一张商品的图片搜索同样或相似图片的所有商品,并从中获得同样或相似图片的其他图片信息和商品型号、名称、商家名等信息,然后以获得的其他新的图片信息进行下一轮同样的搜索,直至搜索结束;同时以获得的商品型号、名称、商家名等进行关键词搜索,以获得新的商品图片等,根据需要以上述新的商品图片信息进行下一轮搜索以获得所有相同或相似的商品信息,包括商品图片等,或商品型号等,直至搜索结束;搜索时也可以直接从商品型号、名称等进行关键词搜索以获得商品图片信息,然后以商品图片信息搜索同样或相似的商品,并重复搜索直至达到搜索要求为止。
8.一种索引数据库的建立方法,其特征在于把网页的信息,网页基本信息、图片、视频、音声等信息,其中网页基本信息包括网页所在URL、编码类型、关键词、关键词位置、生成时间、大小和与其他网页的链接关系等,图片、视频、音声等信息则包括从图片、视频、音声等信息中提取的特征值,如图像的颜色、形状、纹理、空间关系等,建立多维信息索引数据库,然后在索引数据库中的任意一个索引数据中选择一个或多个索引数据以外的数据作为搜索条件在上述多维信息索引数据库中搜索具有相同或相似列数据的行数据,并将其归为同类或相似类建立新的索引数据库,然后依次在这些行数据中选择另一个或多个其他数据作为新的搜索条件,重复以上过程直至新的索引数据库建成。
9.根据权利要求8所述的索引数据库的建立方法应用于商品搜索时,商品的多维信息索引数据可包括商品名、分类、型号、尺寸、图案、样式、板型、适合人群、材质、名称、价格、商家名、简要说明、链接等网页信息和商品图片的颜色、形状、纹理等特征信息,索引数据库可以从一张商品的图片搜索同样或相似图片的所有商品,并从中获得同样或相似图片的其他图片信息和商品型号、名称、商家名等信息,进行同类或相似类化的归类处理,然后以获得的其他新的图片信息进行下一轮同样的搜索,直至搜索结束;同时以获得的商品型号、名称、商家名等进行关键词搜索,以获得新的商品图片等,根据需要以上述新的商品图片信息进行下一轮搜索以获得所有相同或相似的商品信息,包括商品图片等,或商品型号等,进行同类或相似类化的归类处理,直至搜索结束;搜索时也可以直接从商品型号、名称等进行关键词搜索以获得商品图片信息,然后以商品图片信息搜索同样或相似的商品,并进行同类或相似类化的归类处理,重复搜索直至达到搜索要求为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010189350A CN101847161A (zh) | 2010-06-02 | 2010-06-02 | 搜索网页的方法和建立数据库的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010189350A CN101847161A (zh) | 2010-06-02 | 2010-06-02 | 搜索网页的方法和建立数据库的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101847161A true CN101847161A (zh) | 2010-09-29 |
Family
ID=42771780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010189350A Pending CN101847161A (zh) | 2010-06-02 | 2010-06-02 | 搜索网页的方法和建立数据库的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101847161A (zh) |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980497A (zh) * | 2010-10-20 | 2011-02-23 | 北京开心人信息技术有限公司 | 一种分类显示好友动态的方法与系统 |
CN102130848A (zh) * | 2011-03-15 | 2011-07-20 | 苏州阔地网络科技有限公司 | 一种筛选动态信息的方法及装置 |
CN102169490A (zh) * | 2011-03-15 | 2011-08-31 | 苏州阔地网络科技有限公司 | 一种实现社区成员信息互动的方法及装置 |
CN102184185A (zh) * | 2011-04-12 | 2011-09-14 | 北京百度网讯科技有限公司 | 一种用于多媒体资源搜索的方法与设备 |
CN102663025A (zh) * | 2012-03-22 | 2012-09-12 | 浙江盘石信息技术有限公司 | 一种违规在线商品检测方法 |
CN102855320A (zh) * | 2012-09-04 | 2013-01-02 | 珠海市君天电子科技有限公司 | 一种利用搜索引擎对关键词相关url的收集方法和装置 |
CN102902771A (zh) * | 2012-09-27 | 2013-01-30 | 百度国际科技(深圳)有限公司 | 一种图片搜索方法、装置及服务器 |
CN102970578A (zh) * | 2012-11-19 | 2013-03-13 | 北京十分科技有限公司 | 一种多媒体信息识别、训练的方法及装置 |
CN102968510A (zh) * | 2012-12-21 | 2013-03-13 | 厦门市美亚柏科信息股份有限公司 | 互联网人物信息的搜索方法及系统 |
CN103106240A (zh) * | 2012-12-12 | 2013-05-15 | 江苏乐买到网络科技有限公司 | 一种网络购物中搜索商品的方法 |
CN103412937A (zh) * | 2013-08-22 | 2013-11-27 | 成都数之联科技有限公司 | 一种基于手持终端的搜索购物方法 |
WO2013185420A1 (zh) * | 2012-06-14 | 2013-12-19 | 中兴通讯股份有限公司 | 图像产品信息提取方法和装置 |
CN103744944A (zh) * | 2013-12-31 | 2014-04-23 | 上海伯释信息科技有限公司 | 网络爬虫在抓取网页或数据时再过滤的方法 |
WO2014067298A1 (zh) * | 2012-11-05 | 2014-05-08 | 腾讯科技(深圳)有限公司 | 实时检索信息获取方法、装置及服务器 |
CN104504109A (zh) * | 2014-12-30 | 2015-04-08 | 百度在线网络技术(北京)有限公司 | 图片搜索方法和装置 |
CN104518952A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 数据处理方法和装置 |
CN104536968A (zh) * | 2014-11-28 | 2015-04-22 | 北京奇虎科技有限公司 | 一种用于优化搜索结果的方法和装置 |
CN104573008A (zh) * | 2015-01-08 | 2015-04-29 | 广东小天才科技有限公司 | 一种网络信息的监控方法及装置 |
CN104699806A (zh) * | 2015-03-20 | 2015-06-10 | 无锡天脉聚源传媒科技有限公司 | 一种视频搜索方法及装置 |
CN104885075A (zh) * | 2013-12-26 | 2015-09-02 | 陶德龙 | 一种利用关键链接执行反向搜索的方法及装置 |
CN104903883A (zh) * | 2012-10-31 | 2015-09-09 | 微软技术许可有限责任公司 | 通过特定于用户的项目列表进行议价 |
CN106776983A (zh) * | 2016-12-06 | 2017-05-31 | 深圳市小满科技有限公司 | 搜索引擎优化装置和方法 |
CN107480282A (zh) * | 2017-08-23 | 2017-12-15 | 深圳天珑无线科技有限公司 | 一种图片搜索的方法及装置 |
CN107704518A (zh) * | 2017-09-01 | 2018-02-16 | 洛阳市恒凯网络技术服务有限公司 | 一种管理网站系统 |
CN108803989A (zh) * | 2018-06-11 | 2018-11-13 | 北京小度信息科技有限公司 | 信息交互方法、装置、电子设备及计算机可读存储介质 |
CN108829844A (zh) * | 2018-06-20 | 2018-11-16 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN108959473A (zh) * | 2018-06-20 | 2018-12-07 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN109801138A (zh) * | 2019-01-21 | 2019-05-24 | 口碑(上海)信息技术有限公司 | 商品图片的搜索方法及装置 |
CN110717091A (zh) * | 2019-09-16 | 2020-01-21 | 苏宁云计算有限公司 | 基于人脸识别的词条数据扩充方法及装置 |
CN110825742A (zh) * | 2019-10-31 | 2020-02-21 | 北京东方通科技股份有限公司 | 一种数据分页检索的方法、装置、电子设备及存储介质 |
CN117009682A (zh) * | 2023-08-08 | 2023-11-07 | 四川企创未来科技服务有限责任公司 | 一种网页搜索内容匹配方法、系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1945581A (zh) * | 2005-09-30 | 2007-04-11 | 通用电气公司 | 计算机辅助域专用实体映射方法及系统 |
CN101287214A (zh) * | 2008-05-13 | 2008-10-15 | 王海燕 | 通过移动终端获取信息并应用的方法和系统 |
-
2010
- 2010-06-02 CN CN201010189350A patent/CN101847161A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1945581A (zh) * | 2005-09-30 | 2007-04-11 | 通用电气公司 | 计算机辅助域专用实体映射方法及系统 |
CN101287214A (zh) * | 2008-05-13 | 2008-10-15 | 王海燕 | 通过移动终端获取信息并应用的方法和系统 |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980497A (zh) * | 2010-10-20 | 2011-02-23 | 北京开心人信息技术有限公司 | 一种分类显示好友动态的方法与系统 |
CN102130848A (zh) * | 2011-03-15 | 2011-07-20 | 苏州阔地网络科技有限公司 | 一种筛选动态信息的方法及装置 |
CN102169490A (zh) * | 2011-03-15 | 2011-08-31 | 苏州阔地网络科技有限公司 | 一种实现社区成员信息互动的方法及装置 |
CN102184185A (zh) * | 2011-04-12 | 2011-09-14 | 北京百度网讯科技有限公司 | 一种用于多媒体资源搜索的方法与设备 |
CN102663025A (zh) * | 2012-03-22 | 2012-09-12 | 浙江盘石信息技术有限公司 | 一种违规在线商品检测方法 |
CN102663025B (zh) * | 2012-03-22 | 2014-04-02 | 浙江盘石信息技术有限公司 | 一种违规在线商品检测方法 |
WO2013185420A1 (zh) * | 2012-06-14 | 2013-12-19 | 中兴通讯股份有限公司 | 图像产品信息提取方法和装置 |
CN103489008B (zh) * | 2012-06-14 | 2017-07-28 | 中兴通讯股份有限公司 | 图像产品信息提取方法和装置 |
CN103489008A (zh) * | 2012-06-14 | 2014-01-01 | 中兴通讯股份有限公司 | 图像产品信息提取方法和装置 |
CN102855320A (zh) * | 2012-09-04 | 2013-01-02 | 珠海市君天电子科技有限公司 | 一种利用搜索引擎对关键词相关url的收集方法和装置 |
CN102902771A (zh) * | 2012-09-27 | 2013-01-30 | 百度国际科技(深圳)有限公司 | 一种图片搜索方法、装置及服务器 |
CN104903883A (zh) * | 2012-10-31 | 2015-09-09 | 微软技术许可有限责任公司 | 通过特定于用户的项目列表进行议价 |
WO2014067298A1 (zh) * | 2012-11-05 | 2014-05-08 | 腾讯科技(深圳)有限公司 | 实时检索信息获取方法、装置及服务器 |
CN103793439A (zh) * | 2012-11-05 | 2014-05-14 | 腾讯科技(深圳)有限公司 | 一种实时检索信息获取方法、装置及服务器 |
CN103793439B (zh) * | 2012-11-05 | 2019-01-15 | 腾讯科技(深圳)有限公司 | 一种实时检索信息获取方法、装置及服务器 |
CN102970578A (zh) * | 2012-11-19 | 2013-03-13 | 北京十分科技有限公司 | 一种多媒体信息识别、训练的方法及装置 |
CN103106240A (zh) * | 2012-12-12 | 2013-05-15 | 江苏乐买到网络科技有限公司 | 一种网络购物中搜索商品的方法 |
CN102968510A (zh) * | 2012-12-21 | 2013-03-13 | 厦门市美亚柏科信息股份有限公司 | 互联网人物信息的搜索方法及系统 |
CN102968510B (zh) * | 2012-12-21 | 2016-05-11 | 厦门市美亚柏科信息股份有限公司 | 互联网人物信息的搜索方法及系统 |
CN103412937A (zh) * | 2013-08-22 | 2013-11-27 | 成都数之联科技有限公司 | 一种基于手持终端的搜索购物方法 |
CN103412937B (zh) * | 2013-08-22 | 2016-12-28 | 成都数之联科技有限公司 | 一种基于手持终端的搜索购物方法 |
CN104518952A (zh) * | 2013-09-30 | 2015-04-15 | 腾讯科技(深圳)有限公司 | 数据处理方法和装置 |
CN104885075B (zh) * | 2013-12-26 | 2019-05-31 | 陶德龙 | 一种利用关键链接执行反向搜索的方法及装置 |
CN104885075A (zh) * | 2013-12-26 | 2015-09-02 | 陶德龙 | 一种利用关键链接执行反向搜索的方法及装置 |
CN103744944A (zh) * | 2013-12-31 | 2014-04-23 | 上海伯释信息科技有限公司 | 网络爬虫在抓取网页或数据时再过滤的方法 |
CN104536968B (zh) * | 2014-11-28 | 2018-01-05 | 北京奇虎科技有限公司 | 一种用于优化搜索结果的方法和装置 |
CN104536968A (zh) * | 2014-11-28 | 2015-04-22 | 北京奇虎科技有限公司 | 一种用于优化搜索结果的方法和装置 |
CN104504109A (zh) * | 2014-12-30 | 2015-04-08 | 百度在线网络技术(北京)有限公司 | 图片搜索方法和装置 |
CN104573008B (zh) * | 2015-01-08 | 2017-11-21 | 广东小天才科技有限公司 | 一种网络信息的监控方法及装置 |
CN104573008A (zh) * | 2015-01-08 | 2015-04-29 | 广东小天才科技有限公司 | 一种网络信息的监控方法及装置 |
CN104699806A (zh) * | 2015-03-20 | 2015-06-10 | 无锡天脉聚源传媒科技有限公司 | 一种视频搜索方法及装置 |
CN104699806B (zh) * | 2015-03-20 | 2018-05-08 | 无锡天脉聚源传媒科技有限公司 | 一种视频搜索方法及装置 |
CN106776983B (zh) * | 2016-12-06 | 2019-03-26 | 深圳市小满科技有限公司 | 搜索引擎优化装置和方法 |
CN106776983A (zh) * | 2016-12-06 | 2017-05-31 | 深圳市小满科技有限公司 | 搜索引擎优化装置和方法 |
CN107480282A (zh) * | 2017-08-23 | 2017-12-15 | 深圳天珑无线科技有限公司 | 一种图片搜索的方法及装置 |
CN107704518A (zh) * | 2017-09-01 | 2018-02-16 | 洛阳市恒凯网络技术服务有限公司 | 一种管理网站系统 |
CN108803989A (zh) * | 2018-06-11 | 2018-11-13 | 北京小度信息科技有限公司 | 信息交互方法、装置、电子设备及计算机可读存储介质 |
CN108829844A (zh) * | 2018-06-20 | 2018-11-16 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN108959473A (zh) * | 2018-06-20 | 2018-12-07 | 聚好看科技股份有限公司 | 一种信息搜索方法及系统 |
CN109801138A (zh) * | 2019-01-21 | 2019-05-24 | 口碑(上海)信息技术有限公司 | 商品图片的搜索方法及装置 |
CN110717091A (zh) * | 2019-09-16 | 2020-01-21 | 苏宁云计算有限公司 | 基于人脸识别的词条数据扩充方法及装置 |
CN110825742A (zh) * | 2019-10-31 | 2020-02-21 | 北京东方通科技股份有限公司 | 一种数据分页检索的方法、装置、电子设备及存储介质 |
CN117009682A (zh) * | 2023-08-08 | 2023-11-07 | 四川企创未来科技服务有限责任公司 | 一种网页搜索内容匹配方法、系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101847161A (zh) | 搜索网页的方法和建立数据库的方法 | |
CN105022827B (zh) | 一种面向领域主题的Web新闻动态聚合方法 | |
Chen et al. | Collabseer: a search engine for collaboration discovery | |
CN102968465B (zh) | 网络信息服务平台及其基于该平台的搜索服务方法 | |
CN104794242B (zh) | 一种搜索方法 | |
CN102043833B (zh) | 一种基于查询词进行搜索的方法和搜索装置 | |
CN103699700B (zh) | 一种搜索引导的生成方法、系统及相关服务器 | |
CN111708740A (zh) | 基于云平台的海量搜索查询日志计算分析系统 | |
AU2006255181A1 (en) | Relationship networks | |
WO2008124536A1 (en) | Discovering and scoring relationships extracted from human generated lists | |
CN102687138A (zh) | 搜索建议聚类和呈现 | |
CN103914492A (zh) | 查询词融合方法、商品信息发布方法和搜索方法及系统 | |
EP2564305A1 (en) | Vertical search-based query method, system and apparatus | |
CN103577432A (zh) | 一种商品信息搜索方法和系统 | |
CN103631794A (zh) | 一种用于对搜索结果进行排序的方法、装置与设备 | |
CN103838785A (zh) | 一种专利领域的垂直搜索引擎 | |
CN102063453A (zh) | 一种用于基于用户的需求进行搜索的方法和设备 | |
CN105512143A (zh) | 一种网页分类方法及装置 | |
CN104021125A (zh) | 一种搜索引擎排序的方法、系统以及一种搜索引擎 | |
CN101957825A (zh) | 基于网页中图像、视频内容的图像搜索方法 | |
CN105740387A (zh) | 一种基于作者频繁模式的科技文献推荐方法 | |
JP5548900B2 (ja) | 複数の属性を利用したWebページ推薦方法 | |
CN105389330A (zh) | 一种跨社区开源资源匹配关联方法 | |
CN101836209A (zh) | 管理信息地图的系统和方法 | |
CN106294784B (zh) | 资源搜索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20100929 |