CN110969517B - 一种招投标生命周期关联方法、系统、存储介质及计算机设备 - Google Patents

一种招投标生命周期关联方法、系统、存储介质及计算机设备 Download PDF

Info

Publication number
CN110969517B
CN110969517B CN201911163233.2A CN201911163233A CN110969517B CN 110969517 B CN110969517 B CN 110969517B CN 201911163233 A CN201911163233 A CN 201911163233A CN 110969517 B CN110969517 B CN 110969517B
Authority
CN
China
Prior art keywords
data
hash
bidding
bid
announcement data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911163233.2A
Other languages
English (en)
Other versions
CN110969517A (zh
Inventor
姜磊
杨钊
赖招展
袁广驰
陈南山
朱振航
何慧
沈广盈
屈吕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brilliant Data Analytics Inc
Original Assignee
Brilliant Data Analytics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brilliant Data Analytics Inc filed Critical Brilliant Data Analytics Inc
Priority to CN201911163233.2A priority Critical patent/CN110969517B/zh
Publication of CN110969517A publication Critical patent/CN110969517A/zh
Application granted granted Critical
Publication of CN110969517B publication Critical patent/CN110969517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及招投标文本挖掘分析技术,为招投标生命周期关联方法、系统、存储介质及计算机设备,其方法包括:对历史数据库的招投标公告数据及需关联数据分别转换为字符编码;分别建立历史数据、需关联数据的哈希表,将招投标公告数据的字符编码转化为哈希签名;构建局部敏感哈希模型并用其将需关联数据、历史数据的哈希表中的哈希签名依次进行匹配,获得候选目标招投标公告数据;将候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对,完全相同时进行编辑距离评分计算;从编辑距离结果中返回编辑距离最短的招投标公告数据的ID作为输出。本发明实现了招投标过程的智能追踪,进而减轻投标者追踪项目进展的成本。

Description

一种招投标生命周期关联方法、系统、存储介质及计算机设备
技术领域
本发明涉及招投标文本挖掘分析技术领域,具体为一种招投标生命周期关联方法、系统、存储介质及计算机设备。
背景技术
在招投标过程中,如何追踪一个项目的发展是应标者加强对招投标项目的理解、及时介入甚至预判招标的重要环节,如何对同一项目的发展进行追踪也是国内外一个重要的研究课题。目前,针对同一项目、同一特征进行追踪的方法主要基于聚类。但是现实中招投标项目众多,并且有些项目在全国范围内进行同时招标,难以用聚类的方法准确甄别分析。
此外,现有的招投标数据分析方法,只是以招投标中的关键信息为基础,建立数据索引,从而方便数据信息的搜索与查找;无法对同一个招投标项目的整个生命周期中,不同的招投标公告信息进行关联分析,对完整的招投标过程进行追踪。
发明内容
针对现有技术所存在的问题,本发明提供一种招投标生命周期关联方法、系统、存储介质及计算机设备,采用大规模相似度计算与文本评分系统来进行文本相似度比对,进而挖掘出隐藏在众多项目公告中的同一招投标项目在生命周期各阶段的不同招投标公告。
根据本发明的招投标生命周期关联方法,包括以下步骤:
S1、获取已有的招投标公告数据,建立历史数据库;
S2、将历史数据库中所有招投标公告数据的标题和内容分词后,转换为字符编码,
S3、建立需关联数据字典,依次将每条招投标公告数据的需关联数据分词后,转换为字符编码;
S4、分别建立历史数据的哈希表与需关联数据的哈希表,通过n个哈希函数将招投标公告数据、需关联数据的字符编码转化为哈希签名,使得每条招投标公告数据都具有n个哈希签名;构建杰卡德相似度阈值为t的局部敏感哈希模型,设定分组数目以及每组包含的哈希函数数量n;
S5、使用局部敏感哈希模型将需关联数据的哈希表中的哈希签名依次与包含所有招投标公告数据的历史数据的哈希表中的哈希签名进行匹配,获得候选目标招投标公告数据;
S6、将候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对;当候选目标招投标公告数据与需关联数据的区域、项目编号、招标人信息完全相同的情况下,进行编辑距离评分计算,获得编辑距离结果;
S7、从编辑距离结果中返回编辑距离最短的招投标公告数据的ID,作为需关联数据的ID。
在优选的实施例中,步骤S5包括:
步骤51、根据哈希函数数量n、杰卡德相似度阈值t对哈希函数进行分区,每个区间的哈希函数数量为C,区间数为B,即:n=B*C;
步骤52、比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名,如果两个文本J、K在B个区间中的某个区间存在相同的哈希签名,局部敏感哈希模型认为招投标公告数据与需关联数据的杰卡德相似度达到杰卡德相似度阈值t;哈希签名相等的概率P为:P=1-(1–r^C)^B,其中r指文本J和文本K使用同一个哈希函数生成的哈希签名相等的概率;
步骤53、若两个文本J、K在B个区间中至少有一个区间内具有相同的哈希签名,则返回两个文本J、K相似的结果。
在优选的实施例中,步骤S6中编辑距离评分计算的方法包括:
步骤61、对目标语句a进行增删改操作,使之变为匹配语句b;
步骤62、通过莱文斯坦距离公式衡量编辑距离:
Figure BDA0002286715580000021
式中,leva,b(i,j)指目标语句a中前i个字符和匹配语句b中前j个字符之间的距离;字符的计数从1开始计算,因此得到的编辑距离是i=|a|,j=|b|时的距离:leva,b(|a|,|b|)。
根据本发明的招投标生命周期关联系统,包括:
数据获取模块,用于获取已有的招投标公告数据,建立历史数据库;
字符编码模块,用于将历史数据库中所有招投标公告数据的标题和内容分词后,转换为字符编码;以及建立需关联数据字典,依次将每条招投标公告数据的需关联数据分词后,转换为字符编码;
哈希签名生成模块,分别建立历史数据的哈希表与需关联数据的哈希表,通过n个哈希函数将招投标公告数据、需关联数据的字符编码转化为哈希签名,使得每条招投标公告数据都具有n个哈希签名;
局部敏感哈希模型建立模块,构建杰卡德相似度阈值为t的局部敏感哈希模型,设定分组数目以及每组包含的哈希函数数量n;
哈希签名匹配模块,使用局部敏感哈希模型将需关联数据的哈希表中的哈希签名依次与包含所有招投标公告数据的历史数据的哈希表中的哈希签名进行匹配,获得候选目标招投标公告数据;
编辑距离计算模块,用于将候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对;当候选目标招投标公告数据与需关联数据的区域、项目编号、招标人信息完全相同的情况下,进行编辑距离评分计算,获得编辑距离结果;
结果输出模块,从编辑距离结果中返回编辑距离最短的招投标公告数据的ID,作为需关联数据的ID。
根据本发明的存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述招投标生命周期关联方法的步骤。
根据本发明的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的招投标生命周期关联方法。
与现有技术相比,本发明的有益效果包括:
1、在招投标项目的整个生命周期中,对招投标项目在生命周期不同阶段的招投标数据进行关联分析,实现了对招投标过程的智能追踪,进而减轻投标者追踪项目进展的成本。
2、此外,可以从历史招投标数据中分析出招投标项目的招投标进展是否存在异常,这种异常可以反应出项目运作的状态,识别出异常招投标项目后可进一步分析异常的原因。而所需的招投标历史数据具有很强的通用性,大多数实施招投标项目的政府机关及企业的招投标管理系统中均有类似的历史数据积累,节约开发成本并易于后期维护。
附图说明
图1为本发明关联方法的流程图;
图2是图1中局部敏感哈希的类别示意图;
图3是本发明一个实施例的实现流程图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明,但本发明的实施方式不限于此。
实施例
本发明主要作为一种关联方法而存在,该方法的运行需要依赖基础招投标信息管理系统,基础数据库已经建立完成,历史数据可以很方便的从Hadoop数据库中获得,下面简称“历史库”。
如图1-3所示,本发明基于大规模相似度计算与文本评分系统,对招投标的生命周期进行关联,其实现招投标生命周期关联的步骤如下:
步骤1、从Hadoop数据库中取出最近N天已有的招投标公告数据,包含ID与标题、内容三个字段,在内存中建立历史数据库;
另外,需要准备好相应的区域、项目编号、招标人等信息用于辅助计算,这些信息不需要进行UTF-8等字符编码转换。
步骤2、将历史数据库中所有招投标公告数据的标题和内容分词后转换为UTF-8等字符编码。例如某条招标公告数据经过处理后具有如下信息:“ID、分词集合、UTF-8编码集合”,在转化成UTF-8编码的过程中,将分词结果的集合(即分词集合)依次进行UTF-8编码,ID是每条招投标公告数据的唯一标识。
步骤3、在内存中建立需关联数据字典,依次将每条招投标公告数据的需关联数据分词后转换为UTF-8字符编码。例如某条招投标公告数据需关联数据经过处理后具有如下信息:“ID、分词集合、UTF-8编码集合”,在转化成UTF-8编码的过程中,将分词结果的集合依次进行UTF-8编码,ID是每条需关联数据的唯一标识。另外,对需关联数据的区域、项目编号、招标人等信息进行读取,用于后续的辅助计算。
本步骤转换为UTF-8字符编码,具体包括:对招投标公告数据的标题以及内容进行拼接后再进行分词操作;对分词结果取集合,去除重复词,得到分词集合;取出分词集合中的词对应的UTF-8字符编码。
步骤4、在内存中分别建立历史数据的哈希表与需关联数据的哈希表,通过n个哈希函数将招投标公告数据、需关联数据的字符编码转化为哈希签名;构建杰卡德相似度阈值为t的局部敏感哈希模型,设定分组数目以及每组包含的哈希函数数量。
本步骤依次使用n个哈希函数计算每条招投标公告数据,将招投标公告数据的字符编码转化为哈希签名,使得每条招投标公告数据都具有n个哈希签名。
历史数据的哈希表与需关联数据的哈希表的数据结构均包含如下字段:“ID、哈希签名”;同时哈希表按照n个哈希签名分为B个区间,每个区间中有C个哈希函数,即:n=B*C。另外需要注意的是,历史数据的哈希表与需关联数据的哈希表的索引也是通过哈希函数进行构建,由相应数据的ID生成索引,所有由该条相应数据生成的哈希签名保存为该条相应数据的值。
步骤5、使用局部敏感哈希模型,将需关联数据的哈希表中的哈希签名依次与包含所有招投标公告数据的历史数据的哈希表中的哈希签名进行比对(即进行匹配),获得候选目标招投标公告数据。
假设历史数据库包含N天的招投标公告数据,历史数据总量为H条。若需关联数据的哈希表中的哈希签名在B个区间的任一个区间与历史数据的哈希表中的哈希签名相等,则将与其在此区间内哈希签名相等的数据作为候选目标招投标公告数据。本步骤共获得杰卡德相似度大于阈值t的M条候选目标招投标公告数据。
实施步骤5的依据为,假设J和K两个文本,生成哈希签名时会有以下三种情形:两个集合都有某个元素的情形,将该情形假设为X类;一个集合中有另一个集合中没有某个元素的情形,将该情形假设为Y类;两个集合都没有某个元素的情形,将该情形假设为Z类。则由于使用哈希函数生成哈希签名时的元素是均匀分布的,所以可以认为在哈希签名中,任意一行出现X类的情形的概率为|X|/(|X|+|Y|)。所以概率P(任意位置出现X类)=|X|/(|X|+|Y|)=Jac(J,K)。而两个杰卡德相似度为s的文本,在所有B个区间中,哈希签名都不相等的概率为:P=(1-r^C)^B,哈希签名相等的概率P为:P=1-(1–r^C)^B,其中r指文本J和文本K使用同一个哈希函数生成的哈希签名相等的概率。
本步骤使用局部敏感哈希模型获得候选目标招投标公告数据的过程,具体包括:
步骤51、根据哈希函数数量n、杰卡德相似度阈值t对哈希函数进行分区,每个区间的哈希函数数量为C,区间数为B,即:n=B*C;
步骤52、比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名,如果两个文本J、K在B个区间中的某个区间存在相同的哈希签名,局部敏感哈希模型认为招投标公告数据与需关联数据的杰卡德相似度达到杰卡德相似度阈值t;哈希签名相等的概率P为:P=1-(1–r^C)^B,其中r指文本J和文本K使用同一个哈希函数生成的哈希签名相等的概率;
步骤53、若两个文本J、K在B个区间中至少有一个区间内具有相同的哈希签名(即两个文本在同一个区间内具有相同的哈希签名),则返回两个文本相似的结果。
其中,比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名的方法,可以为:
步骤521、针对上述B个区间,准备B个哈希表,与区间号相对应;
步骤522、使用哈希函数将每个区间的部分签名映射至对应的哈希表上;
步骤523、遍历所有哈希表,将区间中相等的集合作为候选文本进行比较,找出相似的招投标公告数据与需关联数据。
步骤6、将步骤5采用局部敏感哈希模型得到的M条候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对。
本步骤实施上述信息比对的依据是,本发明关联的招投标公告数据是基于同一项目的不同生命周期进行关联的,同一项目在不同生命周期的公告归属区域、项目编号、招标人等信息应是一致的。
去除比对不通过的数据后,再依次与需关联数据进行编辑距离评分,并得到编辑距离结果。也就是说,当候选目标招投标公告数据与需关联数据的区域、项目编号、招标人信息完全相同的情况下,再进行编辑距离评分计算,获得编辑距离结果。编辑距离评分计算的方法具体包括:
步骤61、对目标语句a进行增删改等操作使之变为匹配语句b;
步骤62、通过下述莱文斯坦距离公式衡量编辑距离:
Figure BDA0002286715580000061
式中,leva,b(i,j)指的是目标语句a中前i个字符和匹配语句b中前j个字符之间的距离。字符的计数从1开始计算,因此得到的编辑距离是i=|a|,j=|b|时的距离:leva,b(|a|,|b|)。
步骤7、从编辑距离结果中返回编辑距离最短的招投标公告数据的ID,作为需关联数据的ID,以供前端查询页面或其他分析使用。
返回编辑距离最短的ID的依据是,在确认基本招投标信息相同的情况下,目标招投标公告数据与需关联数据的文本越相似,则其越可能是正确的关联对。返回编辑距离最短的结果即返回最有可能是与目标招投标公告为同一项目的后续不同生命周期的公告。
软件开发人员准备使用本发明时,只需将图1中的整体流程封装成一个库即可,该库包括以下几个模块:数据获取模块(用于实现上述步骤1)、字符编码模块(用于实现上述步骤2、3)、哈希签名生成模块(用于实现上述步骤4)、局部敏感哈希模型建立模块(用于实现上述步骤4)、哈希签名匹配模块(用于实现上述步骤5)、编辑距离计算模块(用于实现上述步骤6)及结果输出模块(用于实现上述步骤7),从而形成本发明的招投标生命周期管理系统。
本发明的技术方案还可以呈现为一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述招投标生命周期关联方法的各个步骤。
本发明的技术方案亦可以呈现为一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述招投标生命周期关联方法。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种招投标生命周期关联方法,其特征在于,包括以下步骤:
S1、获取已有的招投标公告数据,建立历史数据库;
S2、将历史数据库中所有招投标公告数据的标题和内容分词后,转换为字符编码,
S3、建立需关联数据字典,依次将每条招投标公告数据的需关联数据分词后,转换为字符编码;
S4、分别建立历史数据的哈希表与需关联数据的哈希表,通过n个哈希函数将招投标公告数据、需关联数据的字符编码转化为哈希签名,使得每条招投标公告数据都具有n个哈希签名;构建杰卡德相似度阈值为t的局部敏感哈希模型,设定分组数目以及每组包含的哈希函数数量n;
S5、使用局部敏感哈希模型将需关联数据的哈希表中的哈希签名依次与包含所有招投标公告数据的历史数据的哈希表中的哈希签名进行匹配,获得候选目标招投标公告数据;
S6、将候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对;当候选目标招投标公告数据与需关联数据的区域、项目编号、招标人信息完全相同的情况下,进行编辑距离评分计算,获得编辑距离结果;
S7、从编辑距离结果中返回编辑距离最短的招投标公告数据的ID,作为需关联数据的ID。
2.根据权利要求1所述的招投标生命周期关联方法,其特征在于,步骤S5包括:
步骤51、根据哈希函数数量n、杰卡德相似度阈值t对哈希函数进行分区,每个区间的哈希函数数量为C,区间数为B,即:n=B*C;
步骤52、比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名,如果两个文本J、K在B个区间中的某个区间存在相同的哈希签名,局部敏感哈希模型认为招投标公告数据与需关联数据的杰卡德相似度达到杰卡德相似度阈值t;哈希签名相等的概率P为:P=1-(1–r^C)^B,其中r指文本J和文本K使用同一个哈希函数生成的哈希签名相等的概率;
步骤53、若两个文本J、K在B个区间中至少有一个区间内具有相同的哈希签名,则返回两个文本J、K相似的结果。
3.根据权利要求2所述的招投标生命周期关联方法,其特征在于,比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名的方法,包括:
步骤521、针对B个区间,准备B个哈希表,与区间号相对应;
步骤522、使用哈希函数将每个区间的部分签名映射至对应的哈希表上;
步骤523、遍历所有哈希表,将区间中相等的集合作为候选文本进行比较,找出相似的招投标公告数据与需关联数据。
4.根据权利要求1所述的招投标生命周期关联方法,其特征在于,步骤S6中编辑距离评分计算的方法包括:
步骤61、对目标语句a进行增删改操作,使之变为匹配语句b;
步骤62、通过莱文斯坦距离公式衡量编辑距离:
Figure FDA0002286715570000021
式中,leva,b(i,j)指目标语句a中前i个字符和匹配语句b中前j个字符之间的距离;字符的计数从1开始计算,因此得到的编辑距离是i=|a|,j=|b|时的距离:leva,b(|a|,|b|)。
5.根据权利要求1所述的招投标生命周期关联方法,其特征在于,步骤S3转换为字符编码的过程包括:对招投标公告数据的标题以及内容进行拼接后再进行分词操作;对分词结果取集合,去除重复词,得到分词集合;取出分词集合中的词对应的字符编码。
6.一种招投标生命周期关联系统,其特征在于,包括:
数据获取模块,用于获取已有的招投标公告数据,建立历史数据库;
字符编码模块,用于将历史数据库中所有招投标公告数据的标题和内容分词后,转换为字符编码;以及建立需关联数据字典,依次将每条招投标公告数据的需关联数据分词后,转换为字符编码;
哈希签名生成模块,分别建立历史数据的哈希表与需关联数据的哈希表,通过n个哈希函数将招投标公告数据、需关联数据的字符编码转化为哈希签名,使得每条招投标公告数据都具有n个哈希签名;
局部敏感哈希模型建立模块,构建杰卡德相似度阈值为t的局部敏感哈希模型,设定分组数目以及每组包含的哈希函数数量n;
哈希签名匹配模块,使用局部敏感哈希模型将需关联数据的哈希表中的哈希签名依次与包含所有招投标公告数据的历史数据的哈希表中的哈希签名进行匹配,获得候选目标招投标公告数据;
编辑距离计算模块,用于将候选目标招投标公告数据依次与需关联数据进行区域、项目编号、招标人信息比对;当候选目标招投标公告数据与需关联数据的区域、项目编号、招标人信息完全相同的情况下,进行编辑距离评分计算,获得编辑距离结果;
结果输出模块,从编辑距离结果中返回编辑距离最短的招投标公告数据的ID,作为需关联数据的ID。
7.根据权利要求6所述的招投标生命周期关联系统,其特征在于,哈希签名匹配模块的匹配过程包括:
根据哈希函数数量n、杰卡德相似度阈值t对哈希函数进行分区,每个区间的哈希函数数量为C,区间数为B,即:n=B*C;
比对两个文本J、K是否在B个区间中至少有一个区间存在相同的哈希签名,如果两个文本J、K在B个区间中的某个区间存在相同的哈希签名,局部敏感哈希模型认为招投标公告数据与需关联数据的杰卡德相似度达到杰卡德相似度阈值t;哈希签名相等的概率P为:P=1-(1–r^C)^B,其中r指文本J和文本K使用同一个哈希函数生成的哈希签名相等的概率;
若两个文本J、K在B个区间中至少有一个区间内具有相同的哈希签名,则返回两个文本J、K相似的结果。
8.根据权利要求6所述的招投标生命周期关联系统,其特征在于,编辑距离计算模块中,编辑距离评分计算的方法包括:
步骤61、对目标语句a进行增删改操作,使之变为匹配语句b;
步骤62、通过莱文斯坦距离公式衡量编辑距离:
Figure FDA0002286715570000031
式中,leva,b(i,j)指目标语句a中前i个字符和匹配语句b中前j个字符之间的距离;字符的计数从1开始计算,因此得到的编辑距离是i=|a|,j=|b|时的距离:lev a,b(|a|,|b|)。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现权利要求1-5中任一项所述招投标生命周期关联方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现权利要求1-5中任一项所述的招投标生命周期关联方法。
CN201911163233.2A 2019-11-25 2019-11-25 一种招投标生命周期关联方法、系统、存储介质及计算机设备 Active CN110969517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911163233.2A CN110969517B (zh) 2019-11-25 2019-11-25 一种招投标生命周期关联方法、系统、存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911163233.2A CN110969517B (zh) 2019-11-25 2019-11-25 一种招投标生命周期关联方法、系统、存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN110969517A CN110969517A (zh) 2020-04-07
CN110969517B true CN110969517B (zh) 2023-02-03

Family

ID=70031371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911163233.2A Active CN110969517B (zh) 2019-11-25 2019-11-25 一种招投标生命周期关联方法、系统、存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN110969517B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112419011A (zh) * 2020-12-14 2021-02-26 国泰新点软件股份有限公司 一种公共资源交易推荐方法、装置、计算机可读存储介质
CN112734386A (zh) * 2021-01-13 2021-04-30 国家电网有限公司 基于关联匹配算法的新能源接网全流程贯通方法及系统
CN114943593A (zh) * 2022-07-26 2022-08-26 北京拓普丰联信息科技股份有限公司 一种标讯信息合并方法、装置、电子设备及存储介质
CN117131197B (zh) * 2023-10-27 2024-01-12 北京大学 一种招标书的需求类别处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126614A (zh) * 2016-06-21 2016-11-16 山东合天智汇信息技术有限公司 一种追溯两个企业多层级关联路径的方法及系统
CN110020927A (zh) * 2018-12-11 2019-07-16 浙江工商大学 一种基于区块链的公开招投标方法
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1402856A (zh) * 1999-06-04 2003-03-12 雷克斯·J·克鲁克香克斯 建筑工程投标和合同管理系统、及其基于互联网的方法和计算机程序

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106126614A (zh) * 2016-06-21 2016-11-16 山东合天智汇信息技术有限公司 一种追溯两个企业多层级关联路径的方法及系统
CN110020927A (zh) * 2018-12-11 2019-07-16 浙江工商大学 一种基于区块链的公开招投标方法
CN110148043A (zh) * 2019-03-01 2019-08-20 安徽省优质采科技发展有限责任公司 基于知识图谱的招标采购信息推荐系统及推荐方法

Also Published As

Publication number Publication date
CN110969517A (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN110969517B (zh) 一种招投标生命周期关联方法、系统、存储介质及计算机设备
CN109885692B (zh) 知识数据存储方法、装置、计算机设备和存储介质
CN108717470B (zh) 一种具有高准确度的代码片段推荐方法
KR102230661B1 (ko) Sql 검토 방법, 장치, 서버 및 저장 매체
CN109359172B (zh) 一种基于图划分的实体对齐优化方法
CN107203468B (zh) 一种基于ast的软件版本演化对比分析方法
CN109408578B (zh) 一种针对异构环境监测数据融合方法
CN109933645B (zh) 信息查询方法、装置、计算机设备及存储介质
CN112148843B (zh) 文本处理方法、装置、终端设备和存储介质
CA2882280A1 (en) System and method for matching data using probabilistic modeling techniques
CN108776673B (zh) 关系模式的自动转换方法、装置及存储介质
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN107066262A (zh) 源代码文件克隆邻接表合并检测方法
CN111325030A (zh) 文本标签构建方法、装置、计算机设备和存储介质
CN114817298A (zh) 字段级数据血缘提取方法、装置、设备及存储介质
CN111190873B (zh) 一种用于云原生系统日志训练的日志模式提取方法及系统
CN113901474A (zh) 一种基于函数级代码相似性的漏洞检测方法
CN115658080A (zh) 一种软件开源代码成分的识别方法及系统
CN115858773A (zh) 适用于长文档的关键词挖掘方法、装置及介质
CN113032371A (zh) 数据库语法分析方法、装置和计算机设备
CN114443783B (zh) 一种供应链数据分析和增强处理方法及装置
Pandi et al. A novel similarity measure for sequence data
CN111310442B (zh) 形近字纠错语料挖掘方法、纠错方法、设备及存储介质
CN114547335A (zh) 业务数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant