CN114428891A - 一种网络资源的处理方法、装置、系统、设备及存储介质 - Google Patents

一种网络资源的处理方法、装置、系统、设备及存储介质 Download PDF

Info

Publication number
CN114428891A
CN114428891A CN202111680910.5A CN202111680910A CN114428891A CN 114428891 A CN114428891 A CN 114428891A CN 202111680910 A CN202111680910 A CN 202111680910A CN 114428891 A CN114428891 A CN 114428891A
Authority
CN
China
Prior art keywords
network resource
summary information
network
network resources
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111680910.5A
Other languages
English (en)
Inventor
王斐
赵光宇
李海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111680910.5A priority Critical patent/CN114428891A/zh
Publication of CN114428891A publication Critical patent/CN114428891A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种网络资源的处理方法、装置、系统、设备以及存储介质,涉及人工智能领域,尤其涉及智能搜索领域。具体实现方案为:通过向网络资源发布端提供指定接口,并接收网络资源发布端发送的与网络资源对应的概要信息,并存储至数据存储系统,其中,概要信息包括用于描述所述网络资源的文字和/或多媒体信息。如此获取的概要信息,比起从网页爬取到的概要信息更为准确,也更具时效性,从而搜索到的内容更准确和更全面,也可大幅提升网络资源在用户搜索中的命中率。

Description

一种网络资源的处理方法、装置、系统、设备及存储介质
技术领域
本公开涉及智能搜索领域,尤其涉及一种网络资源处理方法、装置、系统、设备及存储介质。
背景技术
目前,大多数搜索引擎都是通过网页爬虫技术,将网页内容抓取回来,得到一个网络资源链接(url)与网页内容的映射。然后,将网页的内容解析成一个具体的词语(term),并形成词语到网络资源连接(term->url) 的映射关系。
用户在输入查询语句(query)进行数据搜索时的时候,会根据查询语句在词语到网络资源的映射关系中进行匹配,获取对应的网络资源,展示给用户。
如果文章较长或者有多个关键内容时,搜索引擎就难以从网页中解析出完美的词语。在这种情况下,该网页即使很符合用户的需求,也可能无法被检索到。
发明内容
本公开提供了一种网络资源的处理方法、装置、系统、设备以及存储介质。
根据本公开的一方面,提供了一种一种网络资源的处理方法,应用于搜索引擎服务端,包括:接收使用指定接口发送的与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口供网络资源发布端使用以发送概要信息;将网络资源与概要信息的映射关系存储至第一数据存储系统。
根据本公开的另一方面,提供了一种网络资源的处理方法,应用于网络资源发布端,包括:响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口由搜索引擎服务端提供。
根据本公开的另一方面,提供了一种网络资源的处理装置,应用于搜索引擎服务端,包括:网络资源接收模块,用于接收使用指定接口发送的与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口供网络资源发布端使用以发送概要信息;网络资源存储模块,将网络资源与概要信息的映射关系存储至第一数据存储系统。
根据本公开的另一方面,提供了一种网络资源的处理装置,应用于网络资源发布端,包括:网络资源发布模块,用于响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口由搜索引擎服务端提供。
根据本公开的另一方面,提供了一种网络资源的处理系统,包括:搜索引擎服务端,用于执行上述任一项应用于搜索引擎服务端的的网络资源的处理方法;网络资源发布端,用于执行上述任一项应用于网络资源发布端的的网络资源的处理方法。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一项网络资源的处理方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述任一项网络资源的处理方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述任一项网络资源的处理方法。
本公开提供了一种网络资源的处理方法、装置、系统、设备以及存储介质。该方法通过向网络资源发布端提供指定接口,并接收网络资源发布端发送的与网络资源对应的概要信息,并存储至数据存储系统,其中,概要信息包括用于描述网络资源的文字和/或多媒体信息。如此获取的概要信息,比起从网页爬取到的概要信息更为准确,也更具时效性,从而搜索到的内容更准确和更全面,也可大幅提升网络资源在用户搜索中的命中率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开第一实施例在搜索引擎服务端实现网络资源的处理方法的流程示意图;
图2是本公开第二实施例在搜索引擎服务端实现网络资源的处理方法的流程示意图;
图3是本公开第三实施例在网络资源发布端实现网络资源的处理方法的流程示意图;
图4是本公开第四实施例在搜索引擎服务端与网络资源发布端和用户进行交互实现搜索引擎服务的流程示意图;
图5是本公开第一实施例在搜索引擎服务端的网络资源的处理装置的结构示意图;
图6是本公开第三实施例在网络资源发布端的网络资源的处理装置的结构示意图;
图7是用来实现本公开实施例的网络资源的处理的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了本公开一实施例在搜索引擎服务端,实现网络资源的处理方法的主要流程。参见图1,该方法包括:操作S110,接收使用指定接口发送的与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口供网络资源发布端使用以发送概要信息;操作S120,将网络资源与概要信息的映射关系存储至第一数据存储系统。
其中,搜索引擎服务端指用于提供搜索引擎服务的服务器端,通常是高可用的集群服务器。在本公开中,该服务器特指用于接收与网络资源对应的概要信息的服务器。
网络资源发布端,指独立于搜索引擎服务端的第三方网络资源发布端,例如,网站或信息发布平台等。网络资源发布端会定期发布一些网络资源,例如,各种网页或多媒体信息等。
通常,搜索引擎服务端会收集网络资源发布端发布的各种网络资源信息,并为用户提供搜索服务。当用户输入查询语句时,搜索引擎服务端会在收集到的各种网络资源信息中查找,并向用户返回与查询语句匹配的网络资源信息及网络资源。
在操作S110中,接口泛指通过预先定义的标准(例如,语法、参数、规则等与搜索引擎服务端进行交互的接口。在本公开中,该接口可以是用户图形界面(UI),也可以是通过编程实现的应用程序接口(API)。
指定接口指搜索引擎服务端所提供的、供网络资源发布端使用以发送所述概要信息的接口。
如果是用户图形界面,则包括有输入网络资源链接或网络资源标识,以及用于描述所述网络资源的文字和/或多媒体信息等信息的控件;如果是应用程序接口,则包括用于输入网络资源链接或网络资源标识,以及用于描述所述网络资源的文字和/或多媒体信息等信息的调用参数。
搜索引擎服务端在接收使用指定接口发送的与网络资源对应的概要信息时,可通过指定的网络地址、端口或服务来接收与指定接口对应的信息。
概要信息指用于概括网络资源的主要信息,主要用于显示在搜索结果中,提供可供用户加以辨识和选择的补充信息,因此往往篇幅较短,对信息质量(例如,分辨率)的要求也较低。概要信息可以仅包含用于描述所述网络资源的文字;也可以仅包含用于描述所述网络资源的多媒体信息;还可以既包含用于描述所述网络资源的文字,又包含用于描述所述网络资源的多媒体信息。
其中,用于描述所述网络资源的文字可以是关键语句,关键词或概述等。
用于描述所述网络资源的多媒体,则包括一些概要性的图片、语音或视频等。
在实际应用中,还可将多媒体内容存放在网络数据存储系统中,而仅在概要信息中存放可以获取多媒体内容的网络地址,以节省带宽。
在操作S120中,第一数据存储系统可以是任何适用的数据存储系统,例如,数据库、文件系统、LDAP服务器和配置管理服务器等。
在将网络资源与概要信息的映射关系存储至第一数据存储系统时,主要将网络资源链接或网络资源标识作为键,而将概要信息作为与键对应的键值。
之后,这些概要信息就可以作为一种有益的数据补充,为搜索引擎服务端的搜索服务提供更多搜索依据和辅助信息。
如前所述,搜索引擎服务端通常都是通过自行爬取网页内容等方式,主动获取网络资源信息的,而本公开则额外提供了一种接口,供网络资源发布端使用,获取网络资源发布端主动发送的网络资源信息。
由于网络资源发布端更了解其发布的内容,因此网络资源发布端所提供的用于描述网络资源的文字和/或多媒体信息,比起搜索引擎服务端通过程序抓取和分析得到的关键字或多媒体信息,更为准确。
此外,网络资源发布端还可以在网络资源内容发生改变时,实时向搜索引擎服务端发送相应的变化,使搜索引擎服务端及时更新网络资源的相关信息,而无需等待下一次页面爬取操作。
如此,可使得搜索到的内容更准确和更全面,还也可大幅提升网络资源在用户搜索中的命中率。
图2示出了公开另一实施例在搜索引擎服务端应用网络资源的处理方法的主要流程,包括:操作S210,接收使用指定接口发送的与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口供网络资源发布端使用以发送概要信息;
操作S220,对概要信息进行审核得到审核结果;
由于指定接口是发布给网络资源发布端使用的,网络资源发布端通过该指定接口所发布的内容是由网络资源发布端控制的,其中,可能会包含一些不合规的内容或超出指定大小的内容。
因此,在本公开实施例中,增加了对概要信息审核,以免由于概要信息的不合规、质量差或异常大对搜索引擎服务端产生危害。
通常,审核结果会包括类似“通过”或“不通过”的结论信息。如果是类似“不通过”的结论,则还会给出不通过的原因。
操作S230,将审核结果发送给所述概要信息的网络资源发布端;
操作S240,判断审核结果是否为通过,若通过,则继续操作S250,若未通过,则结束本次执行;
操作S250,将网络资源与概要信息的映射关系存储至第一数据存储系统;
操作S260,从概要信息中获取词语;
词语主要指能用来概括网络内容主要内容的一些关键词,该词语主要从概要信息中用于描述网络资源的文字中提取,也可以从概要信息中多媒体信息的标题或描述中提取。
操作S270,将词语与网络资源的映射关系,存储至第二数据存储系统,第二数据存储系统用于返回与搜索语句匹配的词语对应的网络资源。
第二数据存储系统,用于存储词语与网络资源的映射关系,以便搜索引擎根据用户输入的查询语句,从中找到匹配的词语,然后返回与该词语对应的网络资源。
第二数据存储系统通常是现有的已经存在的数据存储系统,其中,还存有搜索引擎服务端通过网页爬虫技术主动获取到的词语与网络资源的映射关系。从概要信息中提取的词语与网络资源的映射关系,可作为一种补充数据,以使搜索结果更为准确,并进一步提高网络资源链在用户搜索中的命中率。
操作S280,从概要信息中获取多媒体信息;
操作S290,将网络资源与多媒体信息的映射关系,存储至第三数据存储系统,第三数据存储系统用于返回与网络资源对应的多媒体信息。
其中,第三数据存储系统通常用于存储与网络资源对应的多媒体信息,而这些多媒体信息,一方面可以用于在展示搜索结果时,作为网络资源的补充信息,以便用户获取有关网络资源的更多体验,从而更为快捷地判断该网络资源是否是用户真正需要的网络资源。
此外,这些多媒体信息还可用作搜索结果排序的考虑因素,从而使更贴近用户需求的搜索结果能排在更为靠前的位置,以节省用户的搜索时间,提高用户使用体验。
需要说明的是,操作S260至操作S290可以在接收结构化信息时执行,但如此会增加处理时间,可能会导致无法及时接收其它网络资源发布端所发送的网络资源信息,或增加系统高峰时段的负载。
因此,操作S260至操作S290,通常是在将网络资源与概要信息的映射关系存储至第一数据存储系统之后,利用系统空闲时间段定时执行的。例如,通过定义例行程序,在每天凌晨1点开始执行。
此外,操作S280并不依赖于操作S260的执行,因此操作S260和操作S280还可并行执行以节省执行时间。
在图2所示的本公开实施例中,在获取到资源发布端通过指定接口发送的与网络资源对应的概要信息之后,还会对网络资源和概要信息进行审核,以免收录无用信息、低质量信息甚至是恶意信息,以确保信息质量和系统安全。
此外,在图2所示的本公开实施例中,还对概要信息进行了进一步的数据挖掘,并可将挖掘到的信息添加到搜索引擎服务使用的数据存储系统中。如此,无需更改搜索引擎服务的现有实现,就可以充分利用到网络资源发布端所提供的网络资源信息,为用户搜索到更多更准确的网络资源。
图3示出了本公开另一实施例在网络资源发布端,实现网络资源的处理方法的主要流程。参见图3,该方法包括:操作310,响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口由搜索引擎服务端提供。
其中,第一条件由网络资源发布端决定,通常为发布网络资源时,例如,首次发布某个网络资源或在修改、删除该网络资源时同时触发。
如此,可使得搜索引擎服务端及时获取网络资源的变化,进而使用户可及时在搜索时获取到网络资源的最新信息。
由于操作310可使得搜索引擎服务端获取到由网络资源发布端提供的信息,因此,网络资源发布端也可以借此更好地推广其所发布的网络资源,使所发布的网络资源在用户的搜索结果中命中率更高。
如果在搜索引擎服务端设置有审核环节,则在本公开实施例中,还会接收概要信息的审核结果;如果审核结果是不通过,则可根据审核结果中提供的原因,修改概要信息,然后再次向搜索引擎服务端发送与网络资源对应的概要信息。如此,可确保送与网络资源对应的概要信息能最终呈现到用户搜索的结果中。
图4示出了本公开另一实施例搜索引擎服务端与网络资源发布端和用户进行交互,实现搜索引擎服务的主要流程,包括:
步骤S410,网络资源发布端通过指定的端口,提交网络资源对应的结构化数据;
在本公开实施例中,使用结构化数据存储网络资源对应的概要信息。其中,结构化数据指使用预定义的信息结构进行组织,可通过固有键值获取相应信息且格式固定的数据,例如,程序中的结构体 (Struct)、对象(Object)、哈希表(Hash)等。
步骤S420,搜索引擎服务端接收到网络资源发布端发送的结构化数据后,对结构化数据并进行审核;
步骤S430,搜索引擎服务端将审核结果反馈给网络资源发布端;
步骤S440,如果审核通过,搜索引擎服务端将接收到的与网络资源对应的结构化数据写到数据库中;
其中包括,将网络资源与结构化数据的映射关系,写入到正排库中;将从结构化数据中提取到的词语与网络资源的映射关系,写入到倒排库中;将结构化数据中网络资源与多媒体之间的映射关系写入到特征库中。
步骤S460,定期从正排序库中提取词语与网络资源的映射关系,写入到倒排库中;
其中,倒排序库是以提取词语为键,根据提取词语获取网络资源的数据库,由于获取资源的顺序(从网络资源获取词语)相反,因此在被称为倒排库。
步骤S470,普通搜索用户输入查询语句,发起搜索;然后搜索引擎服务端,从倒序库中获取与用户输入的查询语句匹配的网络资源,并结合特征库中的多媒体信息进行排序,选取排序靠前的N个结果进行显示,其中,N为自然数,代表一次显示的结果数量。在显示时,从特征库中获取与之对应的多媒体信息与网络资源一同显示。
如此,用户就可以获取到基于网络资源发布端通过指定的端口提供的结构化数据所给出的更多、更准确的搜索结果了。
根据本公开的一实施例,本公开还提供了一种网络资源的处理装置,应用于搜索引擎服务端,如图5所示,该装置50包括:网络资源接收模块501,用于接收使用指定接口发送的与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口供网络资源发布端使用以发送概要信息;网络资源存储模块502,将网络资源与概要信息的映射关系存储至第一数据存储系统。
根据本公开的另一实施例,该装置50,还包括:词语提取模块,用于从概要信息中获取词语;词语映射模块,用于将词语与网络资源的映射关系,存储至第二数据存储系统,第二数据存储系统用于返回与搜索语句匹配的词语对应的网络资源。
根据本公开的另一实施例,该装置50,还包括:多媒体提取模块,用于从概要信息中获取多媒体信息;多媒体映射模块,用于将网络资源与多媒体信息的映射关系,存储至第三数据存储系统,第三数据存储系统用于返回与网络资源对应的多媒体信息。
根据本公开的另一实施例,该装置50,还包括:网络资源审核模块,用于对概要信息进行审核得到审核结果;审核结果发送模块,用于将审核结果发送给概要信息的网络资源发布端。
根据本公开的一实施例,本公开还提供了一种网络资源的处理装置,应用于网络资源发布端,如图6所示,该装置60包括:网络资源发布模块601,用于响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,概要信息包括用于描述网络资源的文字和/或多媒体信息,指定接口由搜索引擎服务端提供。
根据本公开的另一实施例,该装置60,还包括:审核结果接收模块,用于接收概要信息的审核结果;概要信息修改模块,用于根据审核结果,修改概要信息。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种网络资源的处理系统,包括:搜索引擎服务端,用于执行上述任一项应用于搜索引擎服务端的的网络资源的处理方法;网络资源发布端,用于执行上述任一项应用于网络资源发布端的的网络资源的处理方法。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在 RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O) 接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如,本公开网络资源的处理方法。例如,在一些实施例中,本公开网络资源的处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备 700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的网络资源的处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件) 而被配置为执行本公开网络资源的处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/ 或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入) 来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (16)

1.一种网络资源的处理方法,应用于搜索引擎服务端,包括:
接收使用指定接口发送的与网络资源对应的概要信息,所述概要信息包括用于描述所述网络资源的文字和/或多媒体信息,所述指定接口供网络资源发布端使用以发送所述概要信息;
将所述网络资源与所述概要信息的映射关系存储至第一数据存储系统。
2.根据权利要求1所述的方法,还包括:
从所述概要信息中获取词语;
将所述词语与所述网络资源的映射关系,存储至第二数据存储系统,所述第二数据存储系统用于返回与搜索语句匹配的词语对应的网络资源。
3.根据权利要求1所述的方法,还包括:
从所述概要信息中获取多媒体信息;
将所述网络资源与所述多媒体信息的映射关系,存储至第三数据存储系统,所述第三数据存储系统用于返回与所述网络资源对应的多媒体信息。
4.根据权利要求1所述的方法,还包括:
对所述概要信息进行审核得到审核结果;
将所述审核结果发送给所述概要信息的网络资源发布端。
5.一种网络资源的处理方法,应用于网络资源发布端,包括:
响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,所述概要信息包括用于描述所述网络资源的文字和/或多媒体信息,所述指定接口由所述搜索引擎服务端提供。
6.根据权利要求5所述的方法,还包括:
接收所述概要信息的审核结果;
根据所述审核结果,修改所述概要信息。
7.一种网络资源的处理装置,应用于搜索引擎服务端,包括:
网络资源接收模块,用于接收使用指定接口发送的与网络资源对应的概要信息,所述概要信息包括用于描述所述网络资源的文字和/或多媒体信息,所述指定接口供网络资源发布端使用以发送所述概要信息;
网络资源存储模块,将所述网络资源与所述概要信息的映射关系存储至第一数据存储系统。
8.根据权利要求7所述装置,还包括:
词语提取模块,用于从所述概要信息中获取词语;
词语映射模块,用于将所述词语与所述网络资源的映射关系,存储至第二数据存储系统,所述第二数据存储系统用于返回与搜索语句匹配的词语对应的网络资源。
9.根据权利要求7所述装置,还包括:
多媒体提取模块,用于从所述概要信息中获取多媒体信息;
多媒体映射模块,用于将所述网络资源与所述多媒体信息的映射关系,存储至第三数据存储系统,所述第三数据存储系统用于返回与所述网络资源对应的多媒体信息。
10.根据权利要求7所述装置,还包括:
网络资源审核模块,用于对所述概要信息进行审核得到审核结果;
审核结果发送模块,用于将所述审核结果发送给所述概要信息的网络资源发布端。
11.一种网络资源的处理装置,应用于网络资源发布端,包括:
网络资源发布模块,用于响应于第一条件,使用指定接口,向搜索引擎服务端发送与网络资源对应的概要信息,所述概要信息包括用于描述所述网络资源的文字和/或多媒体信息,所述指定接口由所述搜索引擎服务端提供。
12.根据权利要求11所述装置,还包括:
审核结果接收模块,用于接收所述概要信息的审核结果;
概要信息修改模块,用于根据所述审核结果,修改所述概要信息。
13.一种网络资源的处理系统,包括:
搜索引擎服务端,用于执行权利要求1-4任一项所述的网络资源的处理方法;
网络资源发布端,用于执行权利要求5-6任一项所述的网络资源的处理方法。
14.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
15.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
16.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
CN202111680910.5A 2021-12-31 2021-12-31 一种网络资源的处理方法、装置、系统、设备及存储介质 Pending CN114428891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111680910.5A CN114428891A (zh) 2021-12-31 2021-12-31 一种网络资源的处理方法、装置、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111680910.5A CN114428891A (zh) 2021-12-31 2021-12-31 一种网络资源的处理方法、装置、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114428891A true CN114428891A (zh) 2022-05-03

Family

ID=81312204

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111680910.5A Pending CN114428891A (zh) 2021-12-31 2021-12-31 一种网络资源的处理方法、装置、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114428891A (zh)

Similar Documents

Publication Publication Date Title
KR102600018B1 (ko) 엔티티 관계 마이닝 방법, 장치, 전자 기기, 저장 매체 및 프로그램
JP7087121B2 (ja) ランディングページの処理方法、装置、機器及び媒体
CN112559717B (zh) 搜索匹配方法、装置、电子设备以及存储介质
CN109840254A (zh) 一种数据虚拟化及查询方法、装置
EP3822818A1 (en) Method, apparatus, device and storage medium for intelligent response
CN108959294B (zh) 一种访问搜索引擎的方法和装置
CN110990057A (zh) 小程序子链信息的提取方法、装置、设备及介质
CN113568938A (zh) 数据流处理方法、装置、电子设备及存储介质
CN116611411A (zh) 一种业务系统报表生成方法、装置、设备及存储介质
CN113939812A (zh) 使用自然语言输入生成查询
CN113220710B (zh) 数据查询方法、装置、电子设备以及存储介质
CN113656737B (zh) 网页内容展示方法、装置、电子设备以及存储介质
US8655886B1 (en) Selective indexing of content portions
CN112417248A (zh) 寻址关键词的推荐方法、装置、模型、设备和存储介质
CN113792232B (zh) 页面特征计算方法、装置、电子设备、介质及程序产品
CN114996557B (zh) 服务稳定性确定方法、装置、设备以及存储介质
CN115328898A (zh) 一种数据处理方法、装置、电子设备及介质
CN114428891A (zh) 一种网络资源的处理方法、装置、系统、设备及存储介质
CN115237935A (zh) 数据查询方法、装置、计算机设备和计算机可读存储介质
CN115203599B (zh) 信息推荐方法、装置、设备和存储介质
CN113971216B (zh) 数据处理方法、装置、电子设备和存储器
CN113377922B (zh) 用于匹配信息的方法、装置、电子设备以及介质
CN115563183B (zh) 查询方法、装置及程序产品
CN115495528A (zh) 分布式数据库语句执行方法、装置、设备及存储介质
CN115544343A (zh) 汽车信息收集方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination