CN115905489A - 一种提供招投标信息搜索服务的方法 - Google Patents

一种提供招投标信息搜索服务的方法 Download PDF

Info

Publication number
CN115905489A
CN115905489A CN202211463254.8A CN202211463254A CN115905489A CN 115905489 A CN115905489 A CN 115905489A CN 202211463254 A CN202211463254 A CN 202211463254A CN 115905489 A CN115905489 A CN 115905489A
Authority
CN
China
Prior art keywords
keyword
information
bidding
bid
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211463254.8A
Other languages
English (en)
Other versions
CN115905489B (zh
Inventor
黄婉意
卢永松
刘运宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Polytechnic of Construction
Original Assignee
Guangxi Polytechnic of Construction
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Polytechnic of Construction filed Critical Guangxi Polytechnic of Construction
Priority to CN202211463254.8A priority Critical patent/CN115905489B/zh
Publication of CN115905489A publication Critical patent/CN115905489A/zh
Application granted granted Critical
Publication of CN115905489B publication Critical patent/CN115905489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种提供招投标信息搜索服务的方法,包括:预先爬取多个招投标网站的网络页面,提取各网络页面的关键词信息,并基于任一网络页面的关键词信息构建相应招投标信息的信息资料库;获取用户输入的招投标描述文段信息,基于所述招投标描述文段信息行精确检索:在第一搜索结果的数量无法满足需求的情况下,进行扩展检索:基于精确检索的第一搜索结果以及扩展检索的第二搜索结果,输出招投标信息的搜索结果。利用本申请的方法用户可以直接利用其的感兴趣的招标文本信息或者投标人在先的投标文本信息来实现招标信息的检索,提高招投标信息的检索效率。

Description

一种提供招投标信息搜索服务的方法
技术领域
本申请涉及电池技术领域,尤其涉及一种提供招投标信息搜索服务的方法。
背景技术
随着互联网技术的应用推广,电子化招投标让招标行为更加公平、公正与公开,缩减了行业的“灰色地带”,实现了降本增效。随着招标业务与企业采购业务电子化,各类电子招投标交易平台涌现,各类企业自主交易平台诞生,形成信息过载的现象,导致互联网上招标信息多、乱、杂,即招标公告发布平台多、招标公告格式乱、招标公告内容与分布杂乱,阻碍了招投标人快速有效的获取信息。
现有技术中CN115098766A公开了利用目标公告信息的第一关键词数据或第二关键词数据,分析每个关键词对用户的兴趣度参数,并向用户推荐相关兴趣点的招投标信息。
CN105718580A公开了接收招投标信息查询请求,根据查询请求中的关键字查询所述第二数据库,如果存在匹配项,根据该匹配从第二数据库中获取相应的一个或多个关键数据进行展示。
但在实际应用中,用户搜索需要用户自己确定关键词,用户体验不好,搜索效率较低。
发明内容
本申请实施例提供一种提供招投标信息搜索服务的方法,用以实现投标人可以直接利用其的感兴趣的招标文本信息或者投标人在先的投标文本信息来实现招标信息的检索,提高招投标信息的检索效率。
本申请实施例提出一种提供招投标信息搜索服务的方法,用以基于用户输入的招投标描述文段实现招投标信息搜索,包括:
预先爬取多个招投标网站的网络页面,提取各网络页面的关键词信息,并基于任一网络页面的关键词信息构建相应招投标信息的信息资料库,所述信息资料库中包含有与对应招投标信息、呈指定格式的第一关键词字符串,所述第一关键词字符串包含有与对应招投标信息的多个第一关键词;
获取用户输入的招投标描述文段信息,基于所述招投标描述文段信息通过如下方式进行精确检索:
抽取所述招投标描述文段信息中的多个第二关键词;
基于多个第二关键词在语义上的关联程度,将多个第二关键词在语义上进行组合,或,分割,以形成初始关键词集合;
为所述初始关键词集合中的各初始关键词,确定出多个同义词组以及近义词组,以构建扩展关键词集合;
基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配,对匹配结果进行排序,并基于匹配度高于预设阈值的结果确定第一搜索结果;
在第一搜索结果的数量无法满足需求的情况下,通过如下方式进行扩展检索:
为所述扩展关键词集合中的扩展关键词配置用户关注度权重,并根据用户关注度权重对所述扩展关键词集合中的扩展关键词进行分级,任一分级包括相近用户关注度权重范围内的多个扩展关键词,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果;
基于所述第一搜索结果以及所述第二搜索结果,输出招投标信息的搜索结果。
可选的,所述第一关键词字符串包括多个固定顺序的匹配类别的第一关键词以及多个约束类别第一关键词;
其中所述匹配类别为显类别,用于在检索过程中进行关键词匹配,所述约束类别为隐类别,用以为精确检索过程确定约束条件,且不参与扩展检索过程;
所述匹配类别包括:招标性质、项目类型、项目简况、服务范围;
所述约束类别包括:资格要求、投标有效期、投标报价。
可选的,基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配包括:
对任一招投标信息的第一关键词字符串,按照第一关键词字符串的格式顺序,以一个词为一个节点,逐词计算与所述扩展关键词集合中的扩展关键词的相似度,且在匹配过程中,任一关键词相似度低于预设阈值的情况下,将所述任一关键词记录为匹配失败节点,且不执行在后节点的匹配,直至完成各招投标信息的匹配,以获得任一投标信息的匹配链;
基于各招投标信息的第一关键词字符串与所述扩展关键词集合的匹配链长度进行排序;
将匹配链最长的一个或多个招投标信息,作为第一搜索结果。
可选的,还包括:在利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配之前,利用约束类别的第一关键词对所述扩展关键词集合进行过滤,以去除不符合所述约束类别的招投标信息;
在获得第一搜索结果之后,还包括:基于所述招投标描述文段信息的语义顺序,对所述第一搜索结果进行二次过滤。
可选的,在获得第一搜索结果之后还包括:采用如下方式确定第一搜索结果中的任一招投标信息与招投标描述文段的相似度:
Figure BDA0003954113640000041
其中,sim(D,W)表示任一招投标信息D与招投标描述文段W的相似度,M表示匹配链的长度,N表示第一关键词字符串的长度,βi表示匹配的第一关键词字符串中的关键词di与招投标描述文段中的扩展关键词wi的权重,βi基于第一关键词字符串预先配置,sim(di,wi)表示关键词di与扩展关键词wi的相似度。
可选的,为所述扩展关键词集合中的扩展关键词配置用户关注度权重包括:
对于所述初始关键词集合中的任一初始关键词,基于所述任一初始关键词在所述招投标描述文段中的出现位置确定所述任一初始关键词的初始权重,其中出现位置越靠前,配置的初始权重越大;
确定所述初始关键词集合中的任一初始关键词在所述招投标描述文段中的出现频次;
根据所述任一初始关键词的出现频次,调整其初始权重,其中出现频次越高,调整初始权重越大;
为扩展关键词集合中的任一扩展关键词配置相应初始关键词调整后的权重。
可选的,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果包括:
计算任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词之间的相似度;
将任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词中相似度最高的关键词作为该层级的适配词,并将适配词剔除以执行在后分级的相似度计算,直至完成匹配。
本申请实施例还提出一种提供招投标信息搜索服务的系统,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的提供招投标信息搜索服务的方法的步骤。
本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的提供招投标信息搜索服务的方法的步骤。
本申请的方案通过精确检索的顺次正向匹配以及扩展检索的反向匹配,可以基于用户输入的招投标描述文段实现招投标信息搜索,由此用户可以直接利用其的感兴趣的招标文本信息或者投标人在先的投标文本信息来实现招标信息的检索,提高招投标信息的检索效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本实施例的提供招投标信息搜索服务的方法的基本流程示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例提出一种提供招投标信息搜索服务的方法,用以基于用户输入的招投标描述文段实现招投标信息搜索,利用本申请的方法实现招投标信息的检索,如图1所示,包括如下步骤:
在步骤S101中,预先爬取多个招投标网站的网络页面,提取各网络页面的关键词信息,并基于任一网络页面的关键词信息构建相应招投标信息的信息资料库,所述信息资料库中包含有与对应招投标信息、呈指定格式的第一关键词字符串,所述第一关键词字符串包含有与对应招投标信息的多个第一关键词。具体处理过程还可以对多个招投标网站的网络页面进行筛选,去除重复的招投标内容,由此构建信息资料库。具体的第一关键词字符串的配置顺序可以根据招投标内容的事件层次,根据事件层级树状关系选取一个支路来确定第一关键词字符串,或可以为提取的关键词信息进行分类来确定,例如可以在各类别描述的关键词中选取一个来构建任一招投标信息的第一关键词字符串。
本申请中信息资料库可以根据时间的推进,设置相应的更新时间,从而在信息资料库保存招标有效期内的招投标内容,或者在信息资料库中进行分类,例如可以分为时间有效和时间失效两类,便于为投标人反馈招投标历史记录。
在步骤S102中,获取用户输入的招投标描述文段信息,基于所述招投标描述文段信息通过如下方式进行精确检索。本申请实施例中所指的招投标描述文段可以是投标用户选取的与自身公司业务其他的招标信息,或者投标用户曾产于投标的在先的投标信息,例如最能体现公司业务以及业绩的投标信息,也可以是用户自己输入的部分公司描述信息等等。区别与关键词检索,通过输入文段,一方面输入文段能够将投标人的业务能力以及需求描述清楚,另一方面文段可以来自于投标人自身公司业务其他的招标信息,避免投标人逐一确定关键词,并在大量的搜索结果中去人工寻找目标招标信息,提高搜索效率。
在步骤S1021中,抽取所述招投标描述文段信息中的多个第二关键词,具体的可以根据历史招投标数据来确定哪些词属于关键词,从而实现第二关键词的抽取。
在步骤S1022中,基于多个第二关键词在语义上的关联程度,将多个第二关键词在语义上进行组合,或,分割,以形成初始关键词集合。具体的还可以对抽取到的关键词进行合并操作,从而在初始关键词集合中保留数量尽量少、类型尽量多的初始关键词。
在步骤S1022中,为所述初始关键词集合中的各初始关键词,确定出多个同义词组以及近义词组,以构建扩展关键词集合。本示例中对初始关键词集合中的各初始关键词,进行同位扩充,通过扩充能够进一步提高检索准确度。
在步骤S1022中,基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配,对匹配结果进行排序,并基于匹配度高于预设阈值的结果确定第一搜索结果。
本申请实施例提出按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配,也即利用信息资料库中的第一关键词字符串的格式的顺序来对扩展关键词集合进行匹配,由此能够精确检索出最贴合投标人需求的招标信息,并且本申请采用了固定格式的第一关键词字符串,能够在实现精确检索的同时极大降低数据运算量。
在步骤S103中,在第一搜索结果的数量无法满足需求的情况下,具体的对于例如精确检索的结果的条数不满足用户的需求,则通过如下方式进行扩展检索:
在步骤S1031中,为所述扩展关键词集合中的扩展关键词配置用户关注度权重,并根据用户关注度权重对所述扩展关键词集合中的扩展关键词进行分级,任一分级包括相近用户关注度权重范围内的多个扩展关键词,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果。本申请实施例中,通过为扩展关键词集合中的扩展关键词配置用户关注度权重,在利用扩展关键词集合来对第一关键词字符串进行匹配的逆向检索方式,能够极大提高检索面,有效提高招投标信息检索的检索效率。
在步骤S104中,基于所述第一搜索结果以及所述第二搜索结果,输出招投标信息的搜索结果。例如可以基于第一搜索结果以及第二搜索结果向用户呈现,具体呈现的过程可以设置相应的标签,例如精确检索标签或扩展检索标签,以供用户浏览。在一些具体实现中,还可以在检索结果中附上相应招投标信息的关键词以及网址链接。
利用本申请的方案投标人可以直接利用其的感兴趣的招标文本信息或者投标人在先的投标文本信息来实现招标信息的检索,提高招投标信息的检索效率。
在一些实施例中,所述第一关键词字符串包括多个固定顺序的匹配类别的第一关键词以及多个约束类别第一关键词;其中所述匹配类别为显类别,用于在检索过程中进行关键词匹配,所述约束类别为隐类别,用以为精确检索过程确定约束条件,且不参与扩展检索过程。具体的显类别和隐类别可以根据实际需要设置,在一些具体示例中,所述匹配类别包括:招标性质、项目类型、项目简况、服务范围,所述约束类别包括:资格要求、投标有效期、投标报价。本示例中利用显类别参与检索过程,利用隐类别来作为约束条件,具体约束条件可以根据实际需要增减,例如提供对应的配置项来实现。
在一些实施例中,基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配包括:
对任一招投标信息的第一关键词字符串,按照第一关键词字符串的格式顺序,以一个词为一个节点,逐词计算与所述扩展关键词集合中的扩展关键词的相似度,且在匹配过程中,任一关键词相似度低于预设阈值的情况下,将所述任一关键词记录为匹配失败节点,且不执行在后节点的匹配,直至完成各招投标信息的匹配,以获得任一投标信息的匹配链。具体的检索过程可以是在同位扩充的基础上,进行同位检索,以确定出同位的扩展词中相似度最高的扩展关键词,并在后续中可以基于该扩展关键词的相似度来确定最终的整体相似度,具体的相似度计算可以基于语义词典、余弦相似度等方法,在此不做一一赘述。
基于各招投标信息的第一关键词字符串与所述扩展关键词集合的匹配链长度进行排序。本示例中匹配链的长度直接反应了检索过程中的匹配度。
将匹配链最长的一个或多个招投标信息,作为第一搜索结果。
在一些实施例中,在利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配之前,还包括:利用约束类别的第一关键词对所述扩展关键词集合进行过滤,以去除不符合所述约束类别的招投标信息。具体的约束条件可以采用配置项的方式来使得用户可以根据实际需要来进行检索。
在获得第一搜索结果之后,还包括:基于所述招投标描述文段信息的语义顺序,对所述第一搜索结果进行二次过滤。本示例中在扩展关键词集合的基础上进行了同位检索,所匹配的最佳关键词与初始集合可能存在偏差,本示例中通过招投标描述文段信息的语义关系对第一搜索结果进行二次过滤,从而能够进一步保证搜索结果的准确度。
在一些实施例中,在获得第一搜索结果之后还包括:采用如下方式确定第一搜索结果中的任一招投标信息与招投标描述文段的相似度:
Figure BDA0003954113640000091
其中,sim(D,W)表示任一招投标信息D与招投标描述文段W的相似度,M表示匹配链的长度,N表示第一关键词字符串的长度,βi表示匹配的第一关键词字符串中的关键词di与招投标描述文段中的扩展关键词wi的权重,βi基于第一关键词字符串预先配置,sim(di,wi)表示关键词di与扩展关键词wi的相似度。通过本示例设计的任一招投标信息与招投标描述文段的相似度,一方面能够使得第一关键词字符串中的关键词di与招投标描述文段中的扩展关键词wi的匹配数量越多,也即匹配链长度越长,整体权重越大,同时也能凸显在某一个或几个关键词权重较大的情况对整体相似度的影响。
在一些实施例中,为所述扩展关键词集合中的扩展关键词配置用户关注度权重包括:
对于所述初始关键词集合中的任一初始关键词,基于所述任一初始关键词在所述招投标描述文段中的出现位置确定所述任一初始关键词的初始权重,与精确检索不同的是,对于扩展检索,本示例中为初始关键词集合中的任一初始关键词配置权重来完成逆向检索,具体的任一初始关键词在招投标描述文段的出现位置越靠前,配置的初始权重越大。
确定所述初始关键词集合中的任一初始关键词在所述招投标描述文段中的出现频次,根据所述任一初始关键词的出现频次,调整其初始权重,其中出现频次越高,调整初始权重越大。通过这样的方式能够确定出招投标描述文段中的用户更加关注的内容,提高扩展检索的准确度。
为扩展关键词集合中的任一扩展关键词配置相应初始关键词调整后的权重,也即多个扩展关键词对应的一个初始关键词配置出一个权重。在确定出扩展关键词的权重之后,根据权重范围进行分级,将具有相近权重的扩展关键词分为同级,并执行后续检索过程。
在一些实施例中,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果包括:
计算任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词之间的相似度。对于扩展检索,本示例中不再按照第一关键词字符串的顺序来进行,而是逆向通过计算任一分级的多个扩展关键词(或多个初始关键词)与各第一关键词之间的相似度,通过分级检索的方式能够加快扩展检索的速度,提高检索效率。
将任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词中相似度最高的关键词作为该层级的适配词,并将适配词剔除以执行在后分级的相似度计算,直至完成匹配。在具体实现过程中,每一个分级也可以确定出多个适配词,从而可以将适配词在扩展检索结果中示出。
本申请的方案通过精确检索的顺次正向匹配以及扩展检索的反向匹配,可以基于用户输入的招投标描述文段实现招投标信息搜索,由此投标人可以直接利用其的感兴趣的招标文本信息或者投标人在先的投标文本信息来实现招标信息的检索,提高招投标信息的检索效率。
本申请实施例还提出一种提供招投标信息搜索服务的系统,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现前述的提供招投标信息搜索服务的方法的步骤。
本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现前述的提供招投标信息搜索服务的方法的步骤。
此外,尽管已经在本文中描述了示例性实施例,其范围包括任何和所有基于本公开的具有等同元件、修改、省略、组合(例如,各种实施例交叉的方案)、改编或改变的实施例。权利要求书中的元件将被基于权利要求中采用的语言宽泛地解释,并不限于在本说明书中或本申请的实施期间所描述的示例,其示例将被解释为非排他性的。因此,本说明书和示例旨在仅被认为是示例,真正的范围和精神由以下权利要求以及其等同物的全部范围所指示。
以上描述旨在是说明性的而不是限制性的。例如上述示例(或其一个或更多方案)可以彼此组合使用。例如本领域普通技术人员在阅读上述描述时可以使用其它实施例。另外,在上述具体实施方式中,各种特征可以被分组在一起以简单化本公开。这不应解释为一种不要求保护的公开的特征对于任一权利要求是必要的意图。相反,本公开的主题可以少于特定的公开的实施例的全部特征。从而,以下权利要求书作为示例或实施例在此并入具体实施方式中,其中每个权利要求独立地作为单独的实施例,并且考虑这些实施例可以以各种组合或排列彼此组合。本发明的范围应参照所附权利要求以及这些权利要求赋权的等同形式的全部范围来确定。
以上实施例仅为本公开的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本公开的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (9)

1.一种提供招投标信息搜索服务的方法,其特征在于,用以基于用户输入的招投标描述文段实现招投标信息搜索,包括:
预先爬取多个招投标网站的网络页面,提取各网络页面的关键词信息,并基于任一网络页面的关键词信息构建相应招投标信息的信息资料库,所述信息资料库中包含有与对应招投标信息、呈指定格式的第一关键词字符串,所述第一关键词字符串包含有与对应招投标信息的多个第一关键词;
获取用户输入的招投标描述文段信息,基于所述招投标描述文段信息通过如下方式进行精确检索:
抽取所述招投标描述文段信息中的多个第二关键词;
基于多个第二关键词在语义上的关联程度,将多个第二关键词在语义上进行组合,或,分割,以形成初始关键词集合;
为所述初始关键词集合中的各初始关键词,确定出多个同义词组以及近义词组,以构建扩展关键词集合;
基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配,对匹配结果进行排序,并基于匹配度高于预设阈值的结果确定第一搜索结果;
在第一搜索结果的数量无法满足需求的情况下,通过如下方式进行扩展检索:
为所述扩展关键词集合中的扩展关键词配置用户关注度权重,并根据用户关注度权重对所述扩展关键词集合中的扩展关键词进行分级,任一分级包括相近用户关注度权重范围内的多个扩展关键词,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果;
基于所述第一搜索结果以及所述第二搜索结果,输出招投标信息的搜索结果。
2.如权利要求1所述的提供招投标信息搜索服务的方法,其特征在于,所述第一关键词字符串包括多个固定顺序的匹配类别的第一关键词以及多个约束类别第一关键词;
其中所述匹配类别为显类别,用于在检索过程中进行关键词匹配,所述约束类别为隐类别,用以为精确检索过程确定约束条件,且不参与扩展检索过程;
所述匹配类别包括:招标性质、项目类型、项目简况、服务范围;
所述约束类别包括:资格要求、投标有效期、投标报价。
3.如权利要求2所述的提供招投标信息搜索服务的方法,其特征在于,基于扩展关键词集合,按照第一关键词字符串的格式顺序,利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配包括:
对任一招投标信息的第一关键词字符串,按照第一关键词字符串的格式顺序,以一个词为一个节点,逐词计算与所述扩展关键词集合中的扩展关键词的相似度,且在匹配过程中,任一关键词相似度低于预设阈值的情况下,将所述任一关键词记录为匹配失败节点,且不执行在后节点的匹配,直至完成各招投标信息的匹配,以获得任一投标信息的匹配链;
基于各招投标信息的第一关键词字符串与所述扩展关键词集合的匹配链长度进行排序;
将匹配链最长的一个或多个招投标信息,作为第一搜索结果。
4.如权利要求3所述的提供招投标信息搜索服务的方法,其特征在于,还包括:在利用所述第一关键词字符串中的各第一关键词逐词对所述扩展关键词集合进行匹配之前,利用约束类别的第一关键词对所述扩展关键词集合进行过滤,以去除不符合所述约束类别的招投标信息;
在获得第一搜索结果之后,还包括:基于所述招投标描述文段信息的语义顺序,对所述第一搜索结果进行二次过滤。
5.如权利要求3所述的提供招投标信息搜索服务的方法,其特征在于,在获得第一搜索结果之后还包括:采用如下方式确定第一搜索结果中的任一招投标信息与招投标描述文段的相似度:
Figure FDA0003954113630000021
其中,sim(D,W)表示任一招投标信息D与招投标描述文段W的相似度,M表示匹配链的长度,N表示第一关键词字符串的长度,βi表示匹配的第一关键词字符串中的关键词di与招投标描述文段中的扩展关键词wi的权重,βi基于第一关键词字符串预先配置,sim(di,wi)表示关键词di与扩展关键词wi的相似度。
6.如权利要求3所述的提供招投标信息搜索服务的方法,其特征在于,为所述扩展关键词集合中的扩展关键词配置用户关注度权重包括:
对于所述初始关键词集合中的任一初始关键词,基于所述任一初始关键词在所述招投标描述文段中的出现位置确定所述任一初始关键词的初始权重,其中出现位置越靠前,配置的初始权重越大;
确定所述初始关键词集合中的任一初始关键词在所述招投标描述文段中的出现频次;
根据所述任一初始关键词的出现频次,调整其初始权重,其中出现频次越高,调整初始权重越大;
为扩展关键词集合中的任一扩展关键词配置相应初始关键词调整后的权重。
7.如权利要求6所述的提供招投标信息搜索服务的方法,其特征在于,根据所述分级由高到低逐级对所述第一关键词字符串进行匹配,确定第二搜索结果包括:
计算任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词之间的相似度;
将任一分级的多个扩展关键词与任一招投标信息的第一关键词字符串中的各第一关键词中相似度最高的关键词作为该层级的适配词,并将适配词剔除以执行在后分级的相似度计算,直至完成匹配。
8.一种提供招投标信息搜索服务的系统,其特征在于,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的提供招投标信息搜索服务的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的提供招投标信息搜索服务的方法的步骤。
CN202211463254.8A 2022-11-21 2022-11-21 一种提供招投标信息搜索服务的方法 Active CN115905489B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211463254.8A CN115905489B (zh) 2022-11-21 2022-11-21 一种提供招投标信息搜索服务的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211463254.8A CN115905489B (zh) 2022-11-21 2022-11-21 一种提供招投标信息搜索服务的方法

Publications (2)

Publication Number Publication Date
CN115905489A true CN115905489A (zh) 2023-04-04
CN115905489B CN115905489B (zh) 2023-11-17

Family

ID=86474142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211463254.8A Active CN115905489B (zh) 2022-11-21 2022-11-21 一种提供招投标信息搜索服务的方法

Country Status (1)

Country Link
CN (1) CN115905489B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257602A (zh) * 2023-05-16 2023-06-13 北京拓普丰联信息科技股份有限公司 一种基于公共词构建通用词库的方法、装置及电子设备
CN116628140A (zh) * 2023-07-20 2023-08-22 湖南华菱电子商务有限公司 基于人机交互的信息推送方法及装置、人机交互系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
CN108038096A (zh) * 2017-11-10 2018-05-15 平安科技(深圳)有限公司 知识库文档快速检索方法、应用服务器计算机可读存储介质
CN114925260A (zh) * 2022-05-30 2022-08-19 南瑞集团有限公司 一种智能招投标信息契合方法
CN115098766A (zh) * 2022-05-26 2022-09-23 安徽省优质采科技发展有限责任公司 一种电子招投标交易平台招投标信息推荐方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005310094A (ja) * 2003-10-06 2005-11-04 Nippon Telegr & Teleph Corp <Ntt> キーワード拡張装置と方法およびコンテンツ検索システムならびにコンテンツ情報提供システムと方法およびグループ化条件決定装置と方法ならびにプログラム
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
CN108038096A (zh) * 2017-11-10 2018-05-15 平安科技(深圳)有限公司 知识库文档快速检索方法、应用服务器计算机可读存储介质
CN115098766A (zh) * 2022-05-26 2022-09-23 安徽省优质采科技发展有限责任公司 一种电子招投标交易平台招投标信息推荐方法及系统
CN114925260A (zh) * 2022-05-30 2022-08-19 南瑞集团有限公司 一种智能招投标信息契合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
钱程 等: "基于语义扩展的网页标签推荐系统", 《计算机工程与科学》, vol. 34, no. 10 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116257602A (zh) * 2023-05-16 2023-06-13 北京拓普丰联信息科技股份有限公司 一种基于公共词构建通用词库的方法、装置及电子设备
CN116257602B (zh) * 2023-05-16 2023-07-07 北京拓普丰联信息科技股份有限公司 一种基于公共词构建通用词库的方法、装置及电子设备
CN116628140A (zh) * 2023-07-20 2023-08-22 湖南华菱电子商务有限公司 基于人机交互的信息推送方法及装置、人机交互系统
CN116628140B (zh) * 2023-07-20 2023-10-27 湖南华菱电子商务有限公司 基于人机交互的信息推送方法及装置、人机交互系统

Also Published As

Publication number Publication date
CN115905489B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN107229668B (zh) 一种基于关键词匹配的正文抽取方法
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
AU2022201654A1 (en) System and engine for seeded clustering of news events
JP4838529B2 (ja) 検索語提案のためのマルチ型データオブジェクトの強化されたクラスタリング
CN103678576B (zh) 基于动态语义分析的全文检索系统
KR101201037B1 (ko) 키워드와 웹 사이트 콘텐츠 사이의 관련성 검증
CN101364239B (zh) 一种分类目录自动构建方法及相关系统
US6480835B1 (en) Method and system for searching on integrated metadata
US8204874B2 (en) Abbreviation handling in web search
CN105045875B (zh) 个性化信息检索方法及装置
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
US20090024612A1 (en) Full text query and search systems and methods of use
US20100235343A1 (en) Predicting Interestingness of Questions in Community Question Answering
US20090319449A1 (en) Providing context for web articles
US20110125791A1 (en) Query classification using search result tag ratios
CN115905489B (zh) 一种提供招投标信息搜索服务的方法
KR101355945B1 (ko) 온라인 문맥기반 광고 장치 및 방법
CN102254039A (zh) 一种基于搜索引擎的网络搜索方法
WO2010014082A1 (en) Method and apparatus for relating datasets by using semantic vectors and keyword analyses
CN104252456A (zh) 一种权重估计方法、装置及系统
CN101751439A (zh) 基于层次聚类的图像检索方法
CN111444304A (zh) 搜索排序的方法和装置
CN111475725A (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN113468339B (zh) 基于知识图谱的标签提取方法、系统、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant