CN109255059A - 产品基础算法确定方法、装置、计算机设备及存储介质 - Google Patents
产品基础算法确定方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109255059A CN109255059A CN201811010172.1A CN201811010172A CN109255059A CN 109255059 A CN109255059 A CN 109255059A CN 201811010172 A CN201811010172 A CN 201811010172A CN 109255059 A CN109255059 A CN 109255059A
- Authority
- CN
- China
- Prior art keywords
- algorithm
- configurations
- product
- similarity
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 373
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 239000013598 vector Substances 0.000 claims description 151
- 230000011218 segmentation Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 9
- 238000012356 Product development Methods 0.000 abstract description 9
- 239000000047 product Substances 0.000 description 231
- 238000010586 diagram Methods 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 239000006227 byproduct Substances 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000010224 classification analysis Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种产品基础算法确定方法、装置、计算机设备及存储介质,首先获取产品算法配置请求,根据产品算法配置请求获取产品信息,其中,产品信息包括产品类别和产品配置算法;再将产品配置算法进行基础化处理,得到基础配置算法,将产品配置算法中特定的字段进行模糊化处理,以更好地保证后续算法相似性分析的准确性;根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数;最后将相似系数超过预设的相似阈值的基础配置算法确定为产品基础算法。通过对产品信息中使用频率较高的基础配置算法进行提取,并确定为产品基础算法,可以保证后续产品开发过程中减少对应的配置过程,提高产品开发效率。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种产品基础算法确定方法、装置、计算机设备及存储介质。
背景技术
目前,在新产品的开发中,由于产品之间的相似性,有部分实现逻辑和方法都与已经开发好的产品相同,特别是在相同类别的新产品中,这一情况更为普遍。但是,往往在新产品的开发上,仍需要使用代码对整个新产品进行配置,从而实现该新产品的相关功能。如此导致了大量的重复劳动,从而使产品开发效率不高,增加了新产品开发的周期。
发明内容
本发明实施例提供一种产品基础算法确定方法、装置、计算机设备及存储介质,以解决产品开发效率不高的问题。
一种产品基础算法确定方法,包括:
获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
对所述产品配置算法进行基础化处理,得到基础配置算法;
根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
一种产品基础算法确定装置,包括:
产品算法配置请求获取模块,用于获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
基础化处理模块,用于对所述产品配置算法进行基础化处理,得到基础配置算法;
相似系数计算模块,用于根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
产品基础算法确定模块,用于将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述产品基础算法确定方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述产品基础算法确定方法的步骤。
上述产品基础算法确定方法、装置、计算机设备及存储介质中,首先获取产品算法配置请求,根据产品算法配置请求获取产品信息,其中,产品信息包括产品类别和产品配置算法。再将产品配置算法进行基础化处理,得到基础配置算法,将产品配置算法中特定的字段进行模糊化处理,以更好地保证后续算法相似性分析的准确性。根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数;最后将相似系数超过预设的相似阈值的基础配置算法确定为产品基础算法。通过对产品信息中使用率较高的基础配置算法进行提取,并确定为产品基础算法,可以保证后续产品开发过程中减少对应的配置过程,提高产品开发效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中产品基础算法确定方法的一应用环境示意图;
图2是本发明一实施例中产品基础算法确定方法的一示例图;
图3是本发明一实施例中产品基础算法确定方法的另一示例图;
图4是本发明一实施例中产品基础算法确定方法的另一示例图;
图5是本发明一实施例中产品基础算法确定方法的另一示例图;
图6是本发明一实施例中产品基础算法确定方法的另一示例图;
图7是本发明一实施例中产品基础算法确定方法的另一示例图;
图8是本发明一实施例中产品基础算法确定装置的一原理框图;
图9是本发明一实施例中产品基础算法确定装置的另一原理框图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的产品基础算法确定方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。客户端生成产品算法配置请求,并将该产品算法配置请求发送至服务端,服务端根据该获取到的产品算法配置请求进行相应的处理,最终得到产品基础算法。其中,客户端(计算机设备)可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种产品基础算法确定方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
S10:获取产品算法配置请求,根据产品算法配置请求获取产品信息,其中,产品信息包括产品类别和产品配置算法。
其中,产品算法配置请求是指对产品中相关功能对应的实现算法进行配置的触发请求。具体地,可以是用户通过点击客户端中的某个触发链接、按钮或者通过输入特定的指令、信息来触发客户端生成该产品算法配置请求。客户端在生成该产品算法配置请求后将该产品算法配置请求发送至服务端。
服务端在获取到产品算法配置请求之后,根据产品算法配置请求获取产品信息。产品信息为已经开发完成或者上线的相关产品的配置信息,该产品信息包括产品类别和产品配置算法。其中,产品类别为对应产品所属的类别,示例性地,对于保险产品,该产品类别可以为财产保险、人寿保险或健康保险养老保险等;对于实物产品,该产品类别可以为日常、电子、家具或母婴等。而产品配置算法是指对实现该产品功能而采用的算法。
在一个具体实施方式中,该产品算法配置请求包括文件夹标识。该文件夹标识是用于标识服务端内的不同文件。可选地,该文件夹标识可以由数字、字母、符号或者文字中的至少一项组成。在这个实施方式中,服务端内包括有不同的文件夹,不同文件夹里存储有不同的产品信息。即根据不同的文件夹对产品信息进行归类,该具体的归类方式可以根据实际需要而进行设置,在此不再赘述。服务端在获取到产品算法配置请求之后,根据该产品算法配置请求中的文件夹标识,获取该文件夹标识对应的文件夹中的产品信息。
S20:对产品配置算法进行基础化处理,得到基础配置算法。
其中,基础化处理是指对具体的处理算法中的特定字符进行模糊化处理的过程,以还原算法的处理逻辑,而避免特定产品对该算法的影响。示例性地,若存在产品A和产品B,且对应的两个产品的产品配置算法分别为:
产品A:若航班状态为取消,则根据XX责任计算最大给付额;
产品B:若航班状态为取消,则根据YY责任计算最大给付额;
在这两种产品配置算法中,不同之处仅在于具体的赔付责任数据不同,具体的算法处理过程基本是一致的。如果不进行基础化处理,则在后续的相似性分析中,则由于赔付责任数据的不同,有可能会将这两种算法视为不相似的算法。故可以将产品配置算法中特定的字段进行模糊化处理,以更好地保证后续算法相似性分析的准确性。
具体地,可以将产品配置算法中特定的字段进行替换,以得到基础配置算法。将产品配置算法中相同属性的字段(例如:代表赔付责任数据的字段)替换成相同的替换字符串,如此,就可以避免这部分相同属性的字段对后续计算不同产品配置算法的相似性的影响。例如:将上述产品A和产品B中的赔付责任相关的字段替换成相同的替换字符串“赔付责任”或其他统一的字符串。
S30:根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数。
其中,相似性分析是指对特定算法进行相似程度的分析。相似系数为进行相似性分析后得到的对应数值,该相似系数体现了在同一产品类别中每一基础配置算法和其他基础配置算法的相似程度。具体地,可以将每一基础配置算法进行特征向量的转化,并采用向量相似度计算算法对特征向量转化后的基础配置算法进行向量相似度的计算,最终根据计算结果进一步得到每一基础配置算法的相似系数。
具体地,可以预先设置一向量阈值范围,在根据向量相似度计算算法计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度之后,统计向量相似度在向量阈值范围内的数量,即得到该基础配置算法的相似系数。
S40:将相似系数超过预设的相似阈值的基础配置算法确定为产品基础算法。
其中,产品基础算法是指通用性的产品配置算法。相似阈值是一个预先设置的数值,具体地,该数值可以根据该产品类别下产品配置算法的数量来设置。优选地,可以将该产品类别下产品配置算法的数量乘以一定的比例来得到相似阈值,例如:50%、60%、70或者80%等。也可以在不同产品类别下设置一个相同的相似阈值,具体可以视实际需要而设定,在此不做具体限定。
若相似系数超过预设的相似阈值,则说明对应的基础配置算法在不同的产品中使用的频率较高,故将该基础配置算法确定为产品基础算法。
在一个具体实施方式中,在确定产品基础算法之后,还可以将产品基础算法中相似度较高的产品基础算法进行合并,减少重复的产品基础算法,造成不必要的冗余。具体地,可以根据向量相似度算法计算不同产品基础算法的向量相似度,并将向量相似度超过一个预设阈值的产品基础算法进行合并。
在这个实施例中,首先获取产品算法配置请求,根据产品算法配置请求获取产品信息,其中,产品信息包括产品类别和产品配置算法。再将产品配置算法进行基础化处理,得到基础配置算法,将产品配置算法中特定的字段进行模糊化处理,以更好地保证后续算法相似性分析的准确性。根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数;最后将相似系数超过预设的相似阈值的基础配置算法确定为产品基础算法。通过对产品信息中使用率较高的基础配置算法进行提取,并确定为产品基础算法,可以保证后续产品开发过程中减少对应的配置过程,提高产品开发效率。
在一实施例中,如图3所示,对产品配置算法进行基础化处理,得到基础配置算法,具体包括如下步骤:
S21:获取基础化查询信息,基础化查询信息包括N个查询字符串和对应的N个替换字符串,其中,N为正整数。
其中,基础化查询信息是指对产品配置算法进行基础化处理的借鉴信息。基础化查询信息包括N个查询字符串和对应的N个替换字符串,其中,N为正整数。查询字符串用于在基础配置算法中进行匹配查询。可以理解地,基础化查询信息通过根据不同的产品类别来进行预先配置得到,即不同的产品类别中对应的基础化查询信息可以是不同的,以保证基础化查询信息更有针对性。如此,可以通过产品类别类获取对应的基础化查询信息。在一个具体实施方式中,查询字符串可以通过正则表达式来实现,将特定的字段采用正则表达式进行配置,得到查询字符串,再通过该查询字符串在基础配置算法中进行匹配查询。而替换字符串是指和查询字符串对应的字符串,即将基础配置算法中和查询字符串匹配成功的字符串采用替换字符串进行替换。可以理解地,N个替换字符串可以是相同的,也可以是部分相同的。
例如:对于步骤S20中的产品A和产品B中的产品配置算法,分别包含了“XX责任”和“YY责任”代表赔付责任的字符串,若“XX”和“YY”代表了两个数字,而赔付责任的名称均是由“两个数字+责任”二字构成,则可以构建对应的正则表达式“\d{2}责任”作为查询字符串。
S22:根据每一查询字符串在产品配置算法中进行匹配查询。
将基础化查询信息中的每一查询字符串在产品配置算法中进行匹配查询,以获知在产品配置算法中是否有和该查询字符串匹配查询成功的字符串。若在产品配置算法中存在和该查询字符串匹配查询成功的字符串,则匹配查询成功。否则,匹配查询失败。
S23:若查询字符串在产品配置算法中匹配查询成功,则将产品配置算法中与查询字符串匹配查询成功的字符串替换为与查询字符串对应的替换字符串,得到基础配置算法。
在该步骤中,若查询字符串在产品配置算法中匹配查询成功,则对产品配置算法中与查询字符串匹配查询成功的字符串进行替换,替换为与查询字符串对应的替换字符串。具体地,可以采用Javascript中的字符替换函数String.replace()来实现字符串的替换。String.replace()函数用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串。即在String.replace()函数输入对应的正则表达式和替换字符串,即可完成匹配查询和字符串替换的过程。
在将基础化查询信息中每一个查询字符串完成匹配查询和对应的替换步骤之后,即完成了对产品配置算法进行基础化处理,得到基础配置算法。
在这个实施例中,通过借助基础化查询信息来对产品配置算法进行匹配查询和字符串替换操作,以将产品配置算法中特定的字段进行基础化处理,保证了基础化处理的准确性,并更好地保证后续算法相似性分析的准确性。
在一实施例中,如图4所示,根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数,具体包括如下步骤:
S31:采用分词算法对每一基础配置算法中的词汇进行分词处理。
采用分词算法对每一基础配置算法中的词汇进行分词处理。具体地,分词算法可以采用基于字符串匹配的分词算法、基于理解的分词算法或基于统计的分词算法来实现。例如,对于基础配置算法的词汇“若航班状态为取消,则根据赔付责任计算最大给付额”,采用分词算法进行分词处理后得到{“若”、“航班”、“状态”、“为”、“取消”、“则”、“根据”、“赔付”、“责任”、“计算”、“最大”、“给付额”}。
S32:对分词处理后的同一产品类别中的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。
以产品类别为单位,对同一产品类别中的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。即每一基础配置算法的基础特征向量仅适用于在同一产品类别下进行计算。具体地,可以将同一产品类别中出现的词汇预先进行汇总,再为每一基础配置算法中,根据是否出现对应的词汇进行特征向量的转化。或者,根据每一基础配置算法中每一词汇在该产品类别中出现的频率来构建基础特征向量。
S33:根据基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一基础配置算法的相似系数。
具体地,在步骤S32中得到每一基础配置算法的基础特征向量之后,根据向量相似度计算算法计算两个基础配置算法之间的向量相似度。可选地,向量相似度计算算法可以采用欧几里得距离算法、曼哈顿距离算法、明可夫斯基距离算法或者余弦相似度算法等。并且,预先设置一向量阈值范围,在根据向量相似度计算算法计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度之后,统计向量相似度在向量阈值范围内的数量,将每一基础配置算法中向量相似度在向量阈值范围内的数量确定为该基础配置算法的相似系数。
在这个实施例中,采用分词算法对基础配置算法进行分词处理后再进行特征向量转化,以得到每一基础配置算法的基础特征向量。在此基础之上根据基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一基础配置算法的相似系数。保证了相似系数计算的准确性。
在一实施例中,如图5所示,对分词处理后的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量,具体包括如下步骤:
S321:将同一产品类别中的基础配置算法的词汇进行汇总,得到词汇表。
S322:根据词汇表对分词处理后的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。
具体地,将分词处理后的同一产品类别中的基础配置算法中出现的词汇进行汇总,得到一词汇表。然后为每一基础配置算法根据该词汇表设置基础特征向量。其中,基础特征向量中元素的个数就等于词汇表中的词汇个数。若该基础配置算法存在对应的词汇,则在基础特征向量中对应位置的元素值为1,若该基础配置算法不存在对应的词汇,则在基础特征向量中对应位置的元素值为0。
示例性地,若某一类别产品中包括了两个基础配置算法,而分词处理后地两个基础配置算法分别为:A={“若”、“航班”、“状态”、“为”、“取消”、“则”、“根据”、“赔付”、“责任”、“计算”、“最大”、“给付额”};B={“如果”、“航班”、“状态”、“为”、“取消”、“则”、“按照”、“赔付”、“责任”、“计算”、“最大”、“给付额”}。此时,该产品类别下的词汇表为{“若”、“如果”、“航班”、“状态”、“为”、“取消”、“则”、“根据”、“按照”、“赔付”、“责任”、“计算”、“最大”、“给付额”}。对应地,A和B的基础特征向量分别为:
A={1,0,1,1,1,1,1,1,0,1,1,1,1,1,};
B={0,1,1,1,1,1,1,1,1,0,1,1,1,1,}。
在这个实施例中,通过将同一产品类别中的基础配置算法的词汇进行汇总,得到词汇表;并根据词汇表对分词处理后的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。针对不同的产品类别进行有针对性的特征向量转化,提高后续向量相似度计算的准确性。
在一实施例中,如图6所示,根据基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一基础配置算法的相似系数,具体包括如下步骤:
S331:计算同一产品类别中每一基础配置算法和同一产品类别中其他基础配置算法的向量相似度。
具体地,在同一产品类别中依次计算每一基础配置算法和同一产品类别中其他基础配置算法的向量相似度。示例性地,若一个产品类别中有M个基础配置算法,则每一基础配置算法会和同一产品类别中其他的M-1个基础配置算法一一计算向量相似度,即每一基础配置算法会得到M-1个向量相似度。
可选地,采用余弦相似度算法计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度。余弦相似度算法是通过计算两个向量的夹角余弦值来评估两个向量的相似度。余弦相似度的范围在[-1,1]之间,余弦相似度越趋近于1,代表两个向量的方向越接近,两个向量越相似;余弦相似度越趋近于-1,他们的方向越相反;接近于0,表示两个向量近乎于正交。具体地,通过如下公式计算两个基础特征向量的余弦相似度:
其中,cosθ为余弦相似度,A和B分别代表为计算余弦相似度的两个基础特征向量,Ai是基础特征向量A中的第i个元素,Bi是基础特征向量B中的第i个元素。
S332:统计每一基础配置算法中向量相似度在预设的向量阈值范围内的向量数量。
预先设置一向量阈值范围,而后判断每一基础配置算法的向量相似度和向量阈值范围的关系。该向量阈值范围可以根据不同的向量相似度计算算法来对应设置。具体地,若向量相似度在向量阈值范围内,则认为计算该向量相似度的两个基础特征向量是相似的。若向量相似度不在向量阈值范围内,则认为计算该向量相似度的两个基础特征向量是不相似的。统计每一基础配置算法中向量相似度在向量阈值范围内的数量。
S333:将每一基础配置算法的向量数量确定为每一基础配置算法的相似系数。
在得到每一基础配置算法的所述向量数量之后,将每一基础配置算法的所述向量数量确定为每一基础配置算法的所述相似系数。
在这个实施例中,首先计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度;再统计每一基础配置算法中向量相似度在预设的向量阈值范围内的向量数量,最后将每一基础配置算法的向量数量确定为每一基础配置算法的相似系数,保证了相似系数获取的效率和准确性。
在一实施例中,如图7所示,计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度,具体包括如下步骤:
S3311:根据产品类别获取关键词库,根据关键词库生成权重向量。
其中,关键词库是指在基础配置算法中体现重要影响的词汇所组成的词库。该关键词库可以根据产品类别的不同而预先配置。例如:对于分词后的基础配置算法A={“若”、“航班”、“状态”、“为”、“取消”、“则”、“根据”、“赔付”、“责任”、“计算”、“最大”、“给付额”},其中,若航班状态为取消或延迟,可能对于基础配置算法整体来说影响很大,极有可能就导致整个两个算法完全不同。但是在向量相似度的计算中,可能仅是一个词汇的不同。因此,通过构建关键词库,再根据该关键词库生成权重向量,以保证在向量相似度计算的过程中放大关键词库中的词汇的影响。
例如:在步骤S322的例子中,若关键词库中的词汇为取消,则构建的权重向量可以为X={1,1,1,1,K,1,1,1,1,1,1,1,1,1,}。其中,k为大于1的数值,具体可以根据实际需要进行调整。可以理解地,k的值越大,对应词汇对该基础配置算法的影响就越大。
S3312:根据权重向量计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度。
根据权重向量计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度。具体地,在计算向量相似度时根据具体地相似度计算算法结合权重向量计算对应基础配置算法和其他基础配置算法的向量相似度。分别将每一基础配置算法中的基础特征向量对应的元素乘以权重向量中对应位置的元素,以方法关键词库中的词汇的影响。
例如,步骤S322中基础特征向量A和基础特征向量B经过权重向量处理后分别为:
A’={1,0,1,1,k,1,1,1,0,1,1,1,1,1,};
B’={0,1,1,1,k,1,1,1,1,0,1,1,1,1,}。
由此,通过上述特征向量A’和B’计算得到的向量相似度就可以充分结合关键词库的特点,进一步保证后续相似系数获取的准确性。
在这个实施例中,根据产品类别获取关键词库,根据关键词库生成权重向量;并根据权重向量计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度。进一步保证了基础配置算法和其他基础配置算法的向量相似度计算的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种产品基础算法确定装置,该产品基础算法确定装置与上述实施例中产品基础算法确定方法一一对应。如图8所示,该产品基础算法确定装置包括产品算法配置请求获取模块10、基础化处理模块20、相似系数计算模块30和产品基础算法确定模块40。各功能模块详细说明如下:
产品算法配置请求获取模块10,用于获取产品算法配置请求,根据产品算法配置请求获取产品信息,其中,产品信息包括产品类别和产品配置算法。
基础化处理模块20,用于对产品配置算法进行基础化处理,得到基础配置算法。
相似系数计算模块30,用于根据同一产品类别对基础配置算法进行相似性分析,得到每一基础配置算法的相似系数。
产品基础算法确定模块40,用于将相似系数超过预设的相似阈值的基础配置算法确定为产品基础算法。
可选地,如图9所示,基础化处理模块20包括基础化查询信息获取单元21、匹配查询单元22和基础配置算法获取单元23。
基础化查询信息获取单元21,用于获取基础化查询信息,基础化查询信息包括N个查询字符串和对应的N个替换字符串,其中,N为正整数;
匹配查询单元22,用于根据每一查询字符串在产品配置算法中进行匹配查询;
基础配置算法获取单元23,用于若查询字符串在产品配置算法中匹配查询成功,则将产品配置算法中与查询字符串匹配查询成功的字符串替换为与查询字符串对应的替换字符串,得到基础配置算法。
可选地,相似系数计算模块30包括分词处理子模块、基础特征向量转化子模块和相似系数获取子模块。
分词处理子模块,用于采用分词算法对每一基础配置算法中的词汇进行分词处理。
基础特征向量转化子模块,用于对分词处理后的同一产品类别中的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。
相似系数获取子模块,用于根据基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一基础配置算法的相似系数。
可选地,基础特征向量转化子模块包括词汇表获取单元和基础特征向量转化单元。
词汇表获取单元,用于将同一产品类别中的基础配置算法的词汇进行汇总,得到词汇表。
基础特征向量转化单元,用于根据词汇表对分词处理后的每一基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量。
可选地,相似系数获取子模块包括向量相似度计算单元、向量数量统计单元和相似系数获取单元。
向量相似度计算单元,用于计算同一产品类别中每一基础配置算法和同一产品类别中其他基础配置算法的向量相似度。
向量数量统计单元,用于统计每一基础配置算法中向量相似度在预设的向量阈值范围内的向量数量。
相似系数获取单元,用于将每一基础配置算法的向量数量确定为每一基础配置算法的相似系数。
可选地,向量相似度计算单元包括权重向量生成子单元和向量相似度计算子单元。
权重向量生成子单元,用于根据产品类别获取关键词库,根据关键词库生成权重向量。
向量相似度计算子单元,用于根据权重向量计算同一产品类别中每一基础配置算法和其他基础配置算法的向量相似度。
关于产品基础算法确定装置的具体限定可以参见上文中对于产品基础算法确定方法的限定,在此不再赘述。上述产品基础算法确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述产品基础算法方法中使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种产品基础算法确定方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
对所述产品配置算法进行基础化处理,得到基础配置算法;
根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
对所述产品配置算法进行基础化处理,得到基础配置算法;
根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种产品基础算法确定方法,其特征在于,包括:
获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
对所述产品配置算法进行基础化处理,得到基础配置算法;
根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
2.如权利要求1所述的产品基础算法确定方法,其特征在于,所述对所述产品配置算法进行基础化处理,得到基础配置算法,具体包括如下步骤:
获取基础化查询信息,所述基础化查询信息包括N个查询字符串和对应的N个替换字符串,其中,N为正整数;
根据每一所述查询字符串在所述产品配置算法中进行匹配查询;
若所述查询字符串在所述产品配置算法中匹配查询成功,则将所述产品配置算法中与所述查询字符串匹配查询成功的字符串替换为与所述查询字符串对应的替换字符串,得到基础配置算法。
3.如权利要求1所述的产品基础算法确定方法,其特征在于,所述根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数,具体包括如下步骤:
采用分词算法对每一所述基础配置算法中的词汇进行分词处理;
对分词处理后的同一产品类别中的每一所述基础配置算法进行特征向量转化,得到每一所述基础配置算法的基础特征向量;
根据所述基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数。
4.如权利要求3所述的产品基础算法确定方法,其特征在于,所述对分词处理后的每一所述基础配置算法进行特征向量转化,得到每一基础配置算法的基础特征向量,具体包括如下步骤:
将同一产品类别中的基础配置算法的词汇进行汇总,得到词汇表;
根据所述词汇表对分词处理后的每一所述基础配置算法进行特征向量转化,得到每一所述基础配置算法的基础特征向量。
5.如权利要求3所述的产品基础算法确定方法,其特征在于,所述根据所述基础特征向量对同一产品类别的基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数,具体包括如下步骤:
计算同一产品类别中每一所述基础配置算法和同一产品类别中其他基础配置算法的向量相似度;
统计每一所述基础配置算法中向量相似度在预设的向量阈值范围内的向量数量;
将每一所述基础配置算法的所述向量数量确定为每一所述基础配置算法的所述相似系数。
6.如权利要求5所述的产品基础算法确定方法,其特征在于,所述计算同一产品类别中每一所述基础配置算法和同一产品类别中其他基础配置算法的向量相似度,具体包括如下步骤:
根据所述产品类别获取关键词库,根据所述关键词库生成权重向量;
根据所述权重向量计算同一产品类别中每一所述基础配置算法和其他基础配置算法的向量相似度。
7.一种产品基础算法确定装置,其特征在于,包括:
产品算法配置请求获取模块,用于获取产品算法配置请求,根据所述产品算法配置请求获取产品信息,其中,所述产品信息包括产品类别和产品配置算法;
基础化处理模块,用于对所述产品配置算法进行基础化处理,得到基础配置算法;
相似系数计算模块,用于根据同一产品类别对所述基础配置算法进行相似性分析,得到每一所述基础配置算法的相似系数;
产品基础算法确定模块,用于将所述相似系数超过预设的相似阈值的所述基础配置算法确定为产品基础算法。
8.如权利要求7所述的产品基础算法确定装置,其特征在于,基础化处理模块包括:
基础化查询信息获取单元,用于获取基础化查询信息,所述基础化查询信息包括N个查询字符串和对应的N个替换字符串,其中,N为正整数;
匹配查询单元,用于根据每一所述查询字符串在所述产品配置算法中进行匹配查询;
基础配置算法获取单元,用于若所述查询字符串在所述产品配置算法中匹配查询成功,则将所述产品配置算法中与所述查询字符串匹配查询成功的字符串替换为与所述查询字符串对应的替换字符串,得到基础配置算法。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述产品基础算法确定方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述产品基础算法确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010172.1A CN109255059A (zh) | 2018-08-31 | 2018-08-31 | 产品基础算法确定方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811010172.1A CN109255059A (zh) | 2018-08-31 | 2018-08-31 | 产品基础算法确定方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109255059A true CN109255059A (zh) | 2019-01-22 |
Family
ID=65049989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811010172.1A Pending CN109255059A (zh) | 2018-08-31 | 2018-08-31 | 产品基础算法确定方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109255059A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021238563A1 (zh) * | 2020-05-28 | 2021-12-02 | 平安科技(深圳)有限公司 | 基于配置算法的企业运行数据分析方法、装置、电子设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646226A (zh) * | 2012-02-22 | 2012-08-22 | 浪潮电子信息产业股份有限公司 | 一种缩减软件开发和测试周期的方法 |
CN104317604A (zh) * | 2014-11-13 | 2015-01-28 | 中国建设银行股份有限公司 | 一种程序代码生成方法及装置 |
WO2016201964A1 (zh) * | 2015-06-18 | 2016-12-22 | 中兴通讯股份有限公司 | 一种实现测试用例构建的方法及装置 |
US20180091528A1 (en) * | 2016-09-26 | 2018-03-29 | Splunk Inc. | Configuring modular alert actions and reporting action performance information |
CN108345453A (zh) * | 2017-08-01 | 2018-07-31 | 平安科技(深圳)有限公司 | 代码生成方法、代码生成器及可读存储介质 |
-
2018
- 2018-08-31 CN CN201811010172.1A patent/CN109255059A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646226A (zh) * | 2012-02-22 | 2012-08-22 | 浪潮电子信息产业股份有限公司 | 一种缩减软件开发和测试周期的方法 |
CN104317604A (zh) * | 2014-11-13 | 2015-01-28 | 中国建设银行股份有限公司 | 一种程序代码生成方法及装置 |
WO2016201964A1 (zh) * | 2015-06-18 | 2016-12-22 | 中兴通讯股份有限公司 | 一种实现测试用例构建的方法及装置 |
US20180091528A1 (en) * | 2016-09-26 | 2018-03-29 | Splunk Inc. | Configuring modular alert actions and reporting action performance information |
CN108345453A (zh) * | 2017-08-01 | 2018-07-31 | 平安科技(深圳)有限公司 | 代码生成方法、代码生成器及可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021238563A1 (zh) * | 2020-05-28 | 2021-12-02 | 平安科技(深圳)有限公司 | 基于配置算法的企业运行数据分析方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Amid et al. | TriMap: Large-scale dimensionality reduction using triplets | |
Iglesias et al. | Data augmentation techniques in time series domain: a survey and taxonomy | |
Zhou et al. | Few-shot class-incremental learning by sampling multi-phase tasks | |
US20190340533A1 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
Petitjean et al. | A global averaging method for dynamic time warping, with applications to clustering | |
Liu et al. | Query-adaptive reciprocal hash tables for nearest neighbor search | |
CN108563782B (zh) | 商品信息格式处理方法、装置、计算机设备和存储介质 | |
US11797843B2 (en) | Hashing-based effective user modeling | |
CN109063108B (zh) | 搜索排序方法、装置、计算机设备和存储介质 | |
US10565171B1 (en) | Decision processing applied to data analytics workflow | |
WO2001075790A2 (en) | Method, system, and computer program product for representing object relationships in a multidimensional space | |
CN110880006B (zh) | 用户分类方法、装置、计算机设备和存储介质 | |
US20090049002A1 (en) | System and method for selecting a training sample from a sample test | |
CN113706251B (zh) | 基于模型的商品推荐方法、装置、计算机设备和存储介质 | |
CN111178949A (zh) | 服务资源匹配参考数据确定方法、装置、设备和存储介质 | |
US11288538B2 (en) | Object functionality predication methods, computer device, and storage medium | |
US20220284990A1 (en) | Method and system for predicting affinity between drug and target | |
CN114461906A (zh) | 一种聚焦于用户核心兴趣的序列推荐方法及装置 | |
CN109255059A (zh) | 产品基础算法确定方法、装置、计算机设备及存储介质 | |
CN110866637B (zh) | 评分预测方法、装置、计算机设备和存储介质 | |
US10296928B1 (en) | System and methods for measuring and influencing customer trajectory within a product space | |
US11755671B2 (en) | Projecting queries into a content item embedding space | |
CN109902129A (zh) | 基于大数据分析的保险代理人归类方法及相关设备 | |
US20220237468A1 (en) | Methods and systems for using machine learning models that generate cluster-specific temporal representations for time series data in computer networks | |
CN111459990B (zh) | 对象处理方法、系统及计算机可读存储介质和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |