CN112765492A - 一种检验检测机构排序方法 - Google Patents

一种检验检测机构排序方法 Download PDF

Info

Publication number
CN112765492A
CN112765492A CN202011629461.7A CN202011629461A CN112765492A CN 112765492 A CN112765492 A CN 112765492A CN 202011629461 A CN202011629461 A CN 202011629461A CN 112765492 A CN112765492 A CN 112765492A
Authority
CN
China
Prior art keywords
detection
inspection
similarity
administrative division
checking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011629461.7A
Other languages
English (en)
Other versions
CN112765492B (zh
Inventor
叶金飞
罗鹏
傅潇杭
曹杭平
王春聪
赵怡萍
潘晓晖
王燕
任程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Standardization Research Institute Brics National Standardization Zhejiang Research Center And Zhejiang Article Coding Center
Original Assignee
Zhejiang Fangda Standard Information Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Fangda Standard Information Co ltd filed Critical Zhejiang Fangda Standard Information Co ltd
Priority to CN202011629461.7A priority Critical patent/CN112765492B/zh
Publication of CN112765492A publication Critical patent/CN112765492A/zh
Application granted granted Critical
Publication of CN112765492B publication Critical patent/CN112765492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种检验检测机构排序方法,该方法包括:数据采集:从原始数据库采集检验检测机构的项目数据,所述项目至少包括检验检测机构的识别信息、检验检测机构的检验检测证书、检验检测机构的检测对象类别及检验检测机构的检测能力项目;所述识别信息包含检验检测机构的行政区划和行政区划级别;所述检验检测机构的检测能力项目至少包含项目名称、项目类别、检测标准;采集用户输入的关键词,采用BM25算法,根据关键字段Ti与检验检测机构的各个项目数据的相似度Si加权计算相似度Similarity,并根据目标行政区划进行偏移优化,获得检验检测机构排序。本方法可以快速筛选出符合检测领域需求的检验检测机构。

Description

一种检验检测机构排序方法
技术领域
本发明设计一种快速检索排序方法,特别是一种检验检测机构排序方法。
背景技术
国内具有资质的检验检测机构达数万家,每家机构又各自拥有数千至数万条不同检测资质的对应检测能力项目,从中筛选出符合检测领域需求的检验检测机构难度极高,现有技术不足以支撑完成上述工作。
因此,需要一种检验检测机构排序方法。
发明内容
本发明提供了一种检验检测机构排序方法,
本发明采用如下技术方案:
一种检验检测机构排序方法,
1)数据采集:从原始数据库采集检验检测机构的项目数据,项目至少包括检验检测机构的识别信息、检验检测机构的检验检测证书、检验检测机构的检测对象类别及检验检测机构的检测能力项目;识别信息包含检验检测机构的行政区划和行政区划级别;检验检测机构的检测能力项目至少包含项目名称、项目类别、检测标准;
2)采集用户输入的关键词,将关键词分词后得到关键字段;
3)采用BM25算法,计算关键字段Ti与检验检测机构的各个项目数据的相似度;将针对各个项目数据的相似度进行加权求和后得到该关键字段和该检验检测机构的相似度得分Si;各个关键字段与检验检测机构的相似度得分Si进行加权求和后,得到筛选关键词与检验检测机构的相似度Similarity;
4)采集用户的目标行政区划,对检验检测机构的相似度进行优化;
优化的检验检测机构满足如下条件:(1)行政区划级别高于目标行政区划级别;(2)行政区划包含目标行政区划;
优化方法如下:
Similarity’=((c1+1)+Similarity)/(c1+Similarity)
其中,常量c1为偏移值,Similarity’为偏移后的Similarity值;
检验检测机构的行政区划级别越高,偏移值越低,1≤C1≤5。
5)采用相似度倒排序列的方法将检验检测机构进行排序。
进一步地,目标行政区划为用户输入的行政区划,或为用户所在的行政区划,一般通过GPS定位等方法获得。
与现有技术相比,本发明检验检测机构排序方法和系统的有益效果在于:(1)本发明提供的一种检验检测机构排序方法,本发明能够实现机构的地理定位,有效解决了检验检测事项“谁能办,找谁办,怎么办”的问题,实现了智能检验检测机构快速检索。
附图说明
图1是本发明检验检测机构排序方法的系统架构示意图;
图2是本发明检验检测机构排序方法的索引示意图
具体实施方式
本申请涉及一种检验检测机构排序方法,下面结合附图详细说明具体实施步骤如下:
如图1所示,本实施例由10台服务器组成,其中1台Nginx服务器,两台API服务器,1台业务数据库服务器,1台Redis服务器,3台分布式索引服务器,1台归档数据库服务器,1台原始数据库服务器。
其中,Nginx服务器负责实现反向代理及负载均衡,API服务器负责具体的业务接口实现,并和Redis服务器、分布式索引服务器、业务数据库服务进行交互,业务数据库服务器负责存放具体的业务数据,Redis服务器负责为业务数据库服务器实现缓存,分布式索引服务器负责存放基于归档数据库数据建立的ES索引,归档数据库服务器负责存放归档库数据及数据归档服务,数据归档服务即处理原始数据形成归档库数据后保存到归档库的服务,原始数据库服务器则负责存放原始数据和原始数据获取服务。原始数据获取服务即从云端(各官方数据源)获取原始数据保存到原始数据库的服务程序。
本实施例中将原始库、归档库、业务库、索引、数据库缓存分别存放,从物理上隔绝了不同业务之间的资源竞争,并通过负载均衡大幅提高了并发处理能力和系统的稳定性。
本实施例的排序方法如下:
1)数据采集:从原始数据库采集检验检测机构的项目数据,项目至少包括检验检测机构的识别信息(检验检测机构名称、社会统一信用代码、行政区划、行政区划级别)、检验检测机构的检验检测证书(CMA证书等)、检验检测机构的检测对象类别及检验检测机构的检测能力项目;检验检测机构的检测能力项目至少包含项目名称、项目类别、检测标准;
2)采集用户输入的关键词,将关键词分词后得到关键字段;本实施例中,采用现有的IK分词器进行分词。
3)采用BM25算法,计算关键字段Ti与检验检测机构的各个项目数据的相似度;将针对各个项目数据的相似度进行加权求和后得到该关键字段和该检验检测机构的相似度得分Si;各个关键字段与检验检测机构的相似度得分Si进行加权求和后,得到筛选关键词与检验检测机构的相似度Similarity;
Similarity=∑w*Si
其中,w为各个关键字段与检验检测机构的加权值,w值可以采用均权设定,也可以根据具体业务、需求和程序员的经验进行设定。
在本实施例中,具体设定方法如下:
判断用户输入的关键词是否属于自定义分类的范畴,判断方法如下:
3.0.1.将归档库中的自定义分类及其包含的附属字段信息(分类名称、分类代码、分类特征词、分类关键词)存入Redis
3.0.2.判断用户输入的关键词是否包含在自定义分类的分类名称、分类特征词、分类关键词中,若包含,则直接以命中分类名称、分类特征词对应的分类名称记为keyword1(n),命中分类关键词对应的分类名称记为keyword2(n),其参数后面的下标n意为同一关键词可能名字多个不同的自定义分类,需要分别计算后求和(例如:关键词“手机”既有可能命中类别“通信设备”,也有可能命中类别“电子电器”),通过较短路由快速计算文档得分,计算过程遵循如下公式:
Similarity=Si(原始类别,keyword)+∑(0.7*∑dFreq(自定义类别,keyword1(n))+0.3*∑dFreq(自定义类别,keyword2(n)))
Si(原始类别,keyword)为keyword对目标描述字段【原始类别】的相似度,而dFreq为目标机构文档的子文档(检测项目)中,自定义类别字段包含keyword1的检测项总数,事实上在此公式中,若自定义类别被直接命中,基本在权重上以处于绝对地位,主要影响最终评分的因素是该机构被命中的检测项的总数。
若用户输入的关键词不包含在自定义分类的分类名称、分类特征词、分类关键词中,则直接跳转到3.1进行下一轮计算。
若在具体接口业务中直接指定用户输入的参数类型是类别,则直接以下列公式计算
Similarity=∑dFreq(自定义类别,keyword)
直接以当前步骤得到的Similarity进行倒序排列,给出快速查询排序结果,无须进行后续计算。
否则以3.0.2步骤得出的Similarity进行3.0加权后,直接跳转到3.3步骤,作为3.3步骤的参数进行计算。
例如,用户在浙江省政府附近定位输入关键词“饮料”,如果指定该关键词类型为分类名
则此时索引路由为:饮料->包含“饮料”的子文档(检测项目)—>包含“饮料”的文档(检测机构)
其最终查询结果可能为:
1.中国农业科学院茶叶研究所(地址最近,该机构拥有大量茶饮料、植物饮料,果蔬饮料相关检测项目)
2.杭州市食品药品检验研究院(地址稍远位于石桥路,含有大量饮料相关检测项目,符合饮料的项目比1更多,但经过地理位置正向偏移之后,中国农业科学院茶叶研究所排行更靠前)
3.浙江锐德安正检测认证技术有限公司(同样位于西湖区拥有大量茶饮料、乳饮料相关检测项目,匹配度尚可)
4.杭州市余杭区食品药品监测中心(位于余杭区,拥有大量饮料、、碳酸饮料、冷冻饮料相关检测项目,但距离较远)
5.淳安县食品药品检验检测中心(位于淳安县的区拥有大量茶饮料、豆乳和豆乳饮料、碳酸饮料相关测项目,但距离很远)
又如:用户输入关键词“农夫山泉”,且未指定该关键词类型为分类名,从缓存中快速得出由关键词命中的关键词“包装饮用水”为keyword2(1),以及“水质检验”为keyword2(2),此时通过计算得到Similarity=Si(原始类别,农夫山泉)+(0.3*(dFreq(自定义类别,包装饮用水)+dFreq(自定义类别,水质检验)),再将次数得到的Similarity进行3.0系数加权后转入3.3步骤继续计算。
其最终查询结果大多为包含“包装饮用水”、“水质检验”相关检测项目的机构,并根据地理位置远近和检测项目的多少进行排序,此处不再对结果进行举例。
3.1判断用户输入的关键词(记为keyword)是否是类标准号(符合标准号的格式,但还不能确定),判断方法如下:
3.1.1.国际及国外标准号形式各异,但基本结构为【标准代号+专业类号+顺序号+年代号】从该结构触发订立判断规则
3.1.2.维护标准代号字典,为至少包含"CECS","JTG","JIS L","JIS B","DB","GBZ","JGJ","YD","ISO","JTG F80","Q/","CJJ","JTS","BJS","GB","FZ","HG","WS","JC","JB","JT","JG","SJ","TB","DZ","SL","DL","SY","HJ","GA","B","YY"等等常见国内外标准代号的字符串集合。
3.1.3.去除keyword首尾空格后,通过正则表达式判断用户输入的关键词是否由空格、数字、大小写英文字母、符号/-.组成
3.1.4.将字符串转大写(记为keyword1)后判断字符串起始部分是否包含在可维护的“标准代号字典”当中,如果匹配成功,则将匹配上的部分作为标准代号匹配值,如果匹配失败,直接跳到步骤3.1.9
3.1.5.如果匹配上了DB,则进一步判断起始字符串是否符合正则表达式DB\d{2}.*来判断关键词是否符合地方标准格式,如果匹配成功,则将DB\d{2}作为标准代号匹配值
3.1.6.如果匹配上了Q/,则不进行任何后续补全操作(不执行3.1.7、3.1.8)
3.1.7.在3.1.4-3.1.5步骤中的标准代号匹配值后面插入字符串“/T”,作为推荐性标准代号(记为keyword2)另一份插入“/Z”,作为技术指导文件标准代号(记为keyword3),并分别将【原标准代号匹配值/T】或【原标准代号匹配值/Z】作为keyword2和keyword3的标准代号匹配值。
3.1.8.判断3.1.4、3.1.7、3.1.8步骤中分别记下的keyword1、keyword2、keyword3的标准代号匹配值的后一个字符是否数字,如果是数字则将在“标准代号匹配值”后面的位置插入一个空格来进一步补全标准号格式,并将keyword1补全后的字符串记为keyword4,而keyword2和keyword3则替换原有值,作为候补查询条件以增加用户输入的容错性
3.1.9.对keyword、keword1、keyword2、keyword3、keyword4分别计算其相似度,并按照下列公式加权求和,计算目标文档得分(若步骤3.1.4匹配失败,则除了keyword之外的相似度均为0):
Similarity=Si(keyword)+0.2*Si(keyword1)
+0.2*Si(keyword3)+0.1*Si(keyword4)
在此处Si=0.9*Si(标准号,keyword)+0.1*Si(标准名称,keyword)
其他(keyword1、keyword2、keyword3、keyword4)以此类推,分别代表keyword对目标描述字段【标准号】和目标描述字段【标准名称】的相似度,其权重分别为0.9和0.1.
3.1.10.若步骤3.1.4判断成功,则按步骤3.1.9得出的Similarity进行2.0系数加权,否则将步骤3.1.9中得出的Similarity进行0.1系数加权,然后跳转到3.3默认权重分配规则阶段进行加权求和。
例如:用户输入“gb32610”时,会分别以“GB32610”作为keyword1,“GB/T32610”作为keyword2,“GB/Z 32610”作为keyword3,“GB 32610”作为keyword4,最终成功匹配到正确的标准号“GB/T 32610”,并通过公式计算得分后进行3.0系数加权,作为最终得分中比重最大的一部分。keyword2和keyword3的补全是否开放取决于具体业务,不限于本实施例中的选择。
其最终查询结果大多为包含正确标准号“GB/T 32610”的机构,并根据地理位置远近和检测项目的多少进行排序,此处不再对结果进行举例。
3.2.其次判断用户输入的关键词(记为keyword)是否是机构名称/地址(如果通过了3.1.3的判断步骤,则直接跳过该步骤前往3.3进行最后计算),判断方向如下:
3.2.1.构建三级行政区划地区数据字典,包含国内省级、市级、区县级行政区划名称,存入内存中。
3.2.2.判断用户输入的关键词前两位是否存在于步骤1所建立数据字典中,若不存在,则直接跳转到3.3默认权重分配规则阶段,若存在则进行下一步计算
3.2.3判断用户输入的关键词和步骤1所建立的数据字典中的完整地区名是否一致,如一致则进行下一步计算,如不一致,则对用户输入的关键词进行补全,并记为keyword1(例如:用户输入“浙江方圆”其中浙江存在于地区数据字典中,完整的地区名是“浙江省”,则将用户输入的关键词补全为“浙江省方圆”,以此类推)
3.2.4.对keyword、keword1分别计算其相似度,并按照下列公式加权求和,计算目标文档得分(若3.2.3步骤无需对keyword进行补正,则keyword1的相似度为0):
Similarity=Si(keyword)+0.5*Si(keyword1)
在此处Si==0.7*Si(机构名称,keyword)+0.3*Si(机构地址,keyword)
其他(keyword1)以此类推,分别代表keyword对目标描述字段【机构名称】和目标描述字段【机构地址】的相似度,其权重分别为0.7和0.3
3.2.5.如3.2.2步骤判断失败,则加权系数为0,否则将步骤3.2.3中得出的Similarity进行3.0系数加权,跳转到3.3默认权重分配规则阶段进行加权求和。
3.3.最后使用默认权重分配规则:
若判断进行到该步骤,则说明已经过本实施例所有特殊语义处理阶段,并得到了每个阶段的加权相似度,本实施例仅为其中一种示例,实际操作可以根据业务环境增加其他更多类型的语义判断。
按下列公式计算最终得分
Similarity=Si(keyword)+W(自定义类别)*Similarity(自定义类别)+W(标准号)*Similarity(标准号)+W(机构名称/地址)*Similarity(机构名称/地址)……
在此处Si=1*Si(机构名称,keyword)+0.415*Si(项目名称,keyword)+0.277*Si(标准名称,keyword)+0.139*Si(标准号,keyword)+0.069*Si(原始类别,keyword)+0.097*Si(自定义类别,keyword)+0.001*Si(自定义关键词,keyword)
不同的Si方法代表用户输入的关键词keyword和不同的目标描述字段的相似度。
Similarity(标准号)及其系数来自3.1.10,对其进行加权的原因是该部分字符串通过了正则表达式的标准号元字符串组成判断,Similarity(机构名称/地址)及其系数来自3.2.5步骤。
4)采集用户的目标行政区划,对检验检测机构的相似度进行优化;
目标行政区划为用户输入的行政区划,或为用户所在的行政区划,一般通过GPS定位等方法获得。
优化的检验检测机构满足如下条件:(1)行政区划级别高于目标行政区划级别;(2)行政区划包含目标行政区划;
优化方法如下:
Similarity’=((c1+1)+Similarity)/(c1+Similarity)
其中,常量c1为偏移值,Similarity’为偏移后的Similarity值;
检验检测机构的行政区划级别越高,偏移值越低,1.0≤C1≤5.0。
本实施例中,仅仅涉及浙江省的检测机构筛选,最高级为省级。若用户的目标行政区划为区县级(江干区),则对目标地区所属市级机构(杭州市)和省级机构(浙江省)的相似值进行正向偏移,市级机构的偏移值c1取5.0;省级机构偏移值c1取1.0;
若目标行政区划为市级(绍兴市),则仅仅对目标地区所属省级机构(浙江省)相似值进行正向偏移,常量c1取1.0。
不满足条件的检测机构进行优化。
5)采用相似度倒排序列的方法将检验检测机构进行排序,从而按照用户需求的符合程度,输出检测检验机构的排序。

Claims (2)

1.一种检验检测机构排序方法,其特征在于,
1)数据采集:从原始数据库采集检验检测机构的项目数据,所述项目至少包括检验检测机构的识别信息、检验检测机构的检验检测证书、检验检测机构的检测对象类别及检验检测机构的检测能力项目;所述识别信息包含检验检测机构的行政区划和行政区划级别;所述检验检测机构的检测能力项目至少包含项目名称、项目类别、检测标准;
2)采集用户输入的关键词,将关键词分词后得到关键字段;
3)采用BM25算法,计算所述关键字段Ti与检验检测机构的各个项目数据的相似度;将针对各个项目数据的相似度进行加权求和后得到该关键字段和该检验检测机构的相似度得分Si;各个关键字段与检验检测机构的相似度得分Si进行加权求和后,得到筛选关键词与检验检测机构的相似度Similarity;
4)采集用户的目标行政区划,对检验检测机构的相似度进行优化;
优化的检验检测机构满足如下条件:(1)行政区划级别高于目标行政区划级别;(2)行政区划包含所述目标行政区划;
所述优化方法如下:
Similarity’=((c1+1)+Similarity)/(c1+Similarity)
其中,常量c1为偏移值,Similarity’为偏移后的Similarity值;
检验检测机构的行政区划级别越高,偏移值越低,1≤c1≤5。
5)采用相似度倒排序列的方法将检验检测机构进行排序。
2.根据权利要求1所述的方法,其特征在于,所述目标行政区划为用户输入的行政区划,或为用户所在的行政区划,一般通过GPS定位等方法获得。
CN202011629461.7A 2020-12-31 2020-12-31 一种检验检测机构排序方法 Active CN112765492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011629461.7A CN112765492B (zh) 2020-12-31 2020-12-31 一种检验检测机构排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011629461.7A CN112765492B (zh) 2020-12-31 2020-12-31 一种检验检测机构排序方法

Publications (2)

Publication Number Publication Date
CN112765492A true CN112765492A (zh) 2021-05-07
CN112765492B CN112765492B (zh) 2021-08-10

Family

ID=75699368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011629461.7A Active CN112765492B (zh) 2020-12-31 2020-12-31 一种检验检测机构排序方法

Country Status (1)

Country Link
CN (1) CN112765492B (zh)

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182773A1 (en) * 2004-02-18 2005-08-18 Feinsmith Jason B. Machine-implemented activity management system using asynchronously shared activity data objects and journal data items
US20090240498A1 (en) * 2008-03-19 2009-09-24 Microsoft Corporation Similiarity measures for short segments of text
CN102486781A (zh) * 2010-12-03 2012-06-06 阿里巴巴集团控股有限公司 一种搜索排序方法和装置
CN103310019A (zh) * 2013-07-04 2013-09-18 浙江省方大标准信息有限公司 面向检测机构标准信息与知识服务系统及方法
CN105045875A (zh) * 2015-07-17 2015-11-11 北京林业大学 个性化信息检索方法及装置
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN106934598A (zh) * 2017-03-17 2017-07-07 国网四川省电力公司经济技术研究院 电力项目防重复检测方法及装置
CN107818144A (zh) * 2017-10-17 2018-03-20 郑州云海信息技术有限公司 一种基于Solr对多数据源数据进行整合的方法
CN108038655A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 部门需求的推荐方法、应用服务器及计算机可读存储介质
CN108427743A (zh) * 2018-03-07 2018-08-21 浪潮软件集团有限公司 一种基于地理位置的景点检索与重排序方法
CN109166062A (zh) * 2018-08-07 2019-01-08 苏州承儒信息科技有限公司 一种基于大数据的教育机构推荐方法及其系统
CN109359287A (zh) * 2018-07-12 2019-02-19 福州大学 交互式文化旅游景区景点在线推荐系统及方法
CN109918583A (zh) * 2019-03-18 2019-06-21 河北冀联人力资源服务集团有限公司 一种任务信息处理方法及装置
US20190332682A1 (en) * 2018-04-30 2019-10-31 International Business Machines Corporation Automated selection of search ranker
US10540575B1 (en) * 2015-09-15 2020-01-21 Snap Inc. Ephemeral content management
US20200050638A1 (en) * 2018-08-12 2020-02-13 Parker Douglas Hancock Systems and methods for analyzing the validity or infringment of patent claims
CN111369597A (zh) * 2020-03-09 2020-07-03 南京理工大学 一种基于多特征融合的粒子滤波目标跟踪方法
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
US20200311584A1 (en) * 2019-03-28 2020-10-01 International Business Machines Corporation Assisting prospect evaluation in oil and gas exploration
CN111984873A (zh) * 2020-09-21 2020-11-24 北京信息科技大学 一种服务推荐系统和方法
CN112035741A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 基于用户体检数据的预约方法、装置、设备及存储介质

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050182773A1 (en) * 2004-02-18 2005-08-18 Feinsmith Jason B. Machine-implemented activity management system using asynchronously shared activity data objects and journal data items
US20090240498A1 (en) * 2008-03-19 2009-09-24 Microsoft Corporation Similiarity measures for short segments of text
CN102486781A (zh) * 2010-12-03 2012-06-06 阿里巴巴集团控股有限公司 一种搜索排序方法和装置
CN103310019A (zh) * 2013-07-04 2013-09-18 浙江省方大标准信息有限公司 面向检测机构标准信息与知识服务系统及方法
CN105989040A (zh) * 2015-02-03 2016-10-05 阿里巴巴集团控股有限公司 智能问答的方法、装置及系统
CN105045875A (zh) * 2015-07-17 2015-11-11 北京林业大学 个性化信息检索方法及装置
US10540575B1 (en) * 2015-09-15 2020-01-21 Snap Inc. Ephemeral content management
CN106934598A (zh) * 2017-03-17 2017-07-07 国网四川省电力公司经济技术研究院 电力项目防重复检测方法及装置
CN107818144A (zh) * 2017-10-17 2018-03-20 郑州云海信息技术有限公司 一种基于Solr对多数据源数据进行整合的方法
CN108038655A (zh) * 2017-11-01 2018-05-15 平安科技(深圳)有限公司 部门需求的推荐方法、应用服务器及计算机可读存储介质
CN108427743A (zh) * 2018-03-07 2018-08-21 浪潮软件集团有限公司 一种基于地理位置的景点检索与重排序方法
US20190332682A1 (en) * 2018-04-30 2019-10-31 International Business Machines Corporation Automated selection of search ranker
CN109359287A (zh) * 2018-07-12 2019-02-19 福州大学 交互式文化旅游景区景点在线推荐系统及方法
CN109166062A (zh) * 2018-08-07 2019-01-08 苏州承儒信息科技有限公司 一种基于大数据的教育机构推荐方法及其系统
US20200050638A1 (en) * 2018-08-12 2020-02-13 Parker Douglas Hancock Systems and methods for analyzing the validity or infringment of patent claims
CN109918583A (zh) * 2019-03-18 2019-06-21 河北冀联人力资源服务集团有限公司 一种任务信息处理方法及装置
US20200311584A1 (en) * 2019-03-28 2020-10-01 International Business Machines Corporation Assisting prospect evaluation in oil and gas exploration
CN111415740A (zh) * 2020-02-12 2020-07-14 东北大学 问诊信息的处理方法、装置、存储介质及计算机设备
CN111369597A (zh) * 2020-03-09 2020-07-03 南京理工大学 一种基于多特征融合的粒子滤波目标跟踪方法
CN112035741A (zh) * 2020-08-28 2020-12-04 康键信息技术(深圳)有限公司 基于用户体检数据的预约方法、装置、设备及存储介质
CN111984873A (zh) * 2020-09-21 2020-11-24 北京信息科技大学 一种服务推荐系统和方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIN WANG等: "MF-Join: Efficient Fuzzy String Similarity Join with Multi-level Filtering", 《2019 IEEE 35TH INTERNATIONAL CONFERENCE ON DATA ENGINEERING (ICDE)》 *
刘辉: "海量医疗信息系统推荐技术研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
连誉舜: "中文组织机构名检索系统的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
鲁文: "基于知识服务的船舶检验诱导模式及其关键技术研究", 《中国博士学位论文全文数据库工程科技Ⅱ辑》 *

Also Published As

Publication number Publication date
CN112765492B (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
CN101916382B (zh) 一种植物叶片的图像识别方法
Lengyel et al. Heterogeneity‐constrained random resampling of phytosociological databases
CN104731976A (zh) 数据表中隐私数据的发现与分类方法
CN106296195A (zh) 一种风险识别方法及装置
CN111881302B (zh) 基于知识图谱的银行舆情分析方法和系统
CN111105209A (zh) 适用于人岗匹配推荐系统的职位简历匹配方法及装置
CN105787025A (zh) 网络平台公共账号分类方法及装置
CN110728453B (zh) 一种基于大数据的政策自动匹配分析系统
EP2631815A1 (en) Method and device for ordering search results, method and device for providing information
CN104731977A (zh) 电话号码数据的发现与分类方法
CN103544186A (zh) 挖掘图片中的主题关键词的方法和设备
CN107741960A (zh) Url的分类方法及装置
CN102467544B (zh) 基于空间模糊编码的信息智能搜索方法及系统
CN109165331A (zh) 一种英文地名的索引建立方法及其查询方法和装置
Li et al. An automatic approach for generating rich, linked geo-metadata from historical map images
CN100421107C (zh) 用于关系数据库的超集的数据结构和管理系统
CN112765492B (zh) 一种检验检测机构排序方法
CN103577414B (zh) 数据处理方法和设备
CN113626700A (zh) 律师推荐方法和系统及设备
CN117494132A (zh) 一种智能漏洞复现检索方法及系统
CN115658942A (zh) 一种面向金融场景的联合征信智能化数据检索方法
CN108280176A (zh) 基于MapReduce的数据挖掘优化方法
CN108256086A (zh) 数据特征统计分析方法
CN108897832B (zh) 一种自动分析价值信息的方法与装置
CN107357891A (zh) 一种主页链接推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220711

Address after: Floor 5, Yaojiang development center, No. 305, Huancheng North Road, Hangzhou, Zhejiang 310005

Patentee after: Zhejiang Standardization Research Institute (BRICs National Standardization (Zhejiang) research center and Zhejiang article coding Center)

Address before: 310003 5th floor, Yaojiang development center, No. 305, Huancheng North Road, Hangzhou, Zhejiang

Patentee before: ZHEJIANG FANGDA STANDARD INFORMATION Co.,Ltd.