CN110147887A - 信息推荐方法、装置、介质、电子设备 - Google Patents
信息推荐方法、装置、介质、电子设备 Download PDFInfo
- Publication number
- CN110147887A CN110147887A CN201910321476.8A CN201910321476A CN110147887A CN 110147887 A CN110147887 A CN 110147887A CN 201910321476 A CN201910321476 A CN 201910321476A CN 110147887 A CN110147887 A CN 110147887A
- Authority
- CN
- China
- Prior art keywords
- keyword
- data analysis
- analysis model
- intersection
- matching score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000007405 data analysis Methods 0.000 claims abstract description 127
- 238000004458 analytical method Methods 0.000 claims abstract description 45
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000011218 segmentation Effects 0.000 claims abstract description 20
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000009394 selective breeding Methods 0.000 abstract 1
- 238000003860 storage Methods 0.000 description 17
- 239000000463 material Substances 0.000 description 14
- 238000011156 evaluation Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013210 evaluation model Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000005291 magnetic effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000005242 forging Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 210000000352 storage cell Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及智能决策技术领域,揭示了一种信息推荐方法、装置、介质及电子设备。该方法包括:获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;获取关于决策主体对决策对象的分析需求的描述性语句;对所述描述性语句进行分词处理,以得到存有第二关键词的第二关键词表;基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数,进而根据匹配分数推荐数据分析模型。此方法下,根据决策主体对决策对象的分析需求的描述性语句来匹配数据分析模型,能够缩短人工选择模型的时间,提高工作效率。还能提高匹配精准度,进而优化对决策对象的分析结果。
Description
技术领域
本发明涉及智能决策技术领域,特别涉及一种信息推荐方法、装置、介质及电子设备。
背景技术
目前,随着大数据时代的到来,我们在对一个对象作出决策之前,通常都需要对与这个对象相关的数据进行分析,以保证能够以该分析结果为参考依据,针对对象做出一个科学的,合适的决策。
如上所述的分析过程主要由专门的系统来完成,所述系统中有若干的数据分析模型,专门用于对决策对象的数据分析,不同的数据分析模型适用于决策主体对决策对象的不同分析需求。一般情况下,需要根据分析需求匹配数据分析模型,然后将决策对象的相关数据输入数据分析模型,由数据分析模型对决策对象进行一个分析,以此来满足决策主体的业务需求。在现有技术中,决策主体根据分析需求匹配数据分析模型主要还是通过人工来完成,而工作人员主要根据经验对分析需求与数据分析模型进行匹配。
然而在实际工作中,一方面,决策主体对决策对象的分析需求越来越多样化,数据分析模型也随之越来越多样化。另一方面,决策主体对决策对象的数据分析准确度的要求也越来越高。因此,如何快速的合理匹配数据分析模型与分析需求以使得对决策主体获得的分析结果达到最优就显得十分重要。但是由于人工匹配速度慢,匹配工作模式复杂,因此使得匹配效率低下,并且人工匹配的依据主要是个人经验,所以匹配存在较强的个人主观性,匹配精准度不高。
发明内容
在智能决策技术领域,为了解决相关技术中存在匹配效率低下和匹配精准度不高的技术问题,本发明提供了一种信息推荐方法、装置、介质及电子设备。
根据本申请的一方面,提供了一种信息推荐方法,所述方法包括:
获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;
获取关于决策主体对决策对象的分析内容和需求的描述性语句;
对所述描述性语句进行分词处理,以得到存有第二关键词的第二关键词表;
基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数;
基于所述确定的匹配分数,推荐数据分析模型。
根据本申请的另一方面,提供了一种信息推荐装置,所述装置包括:
第一获取模块,被配置为获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;
第二获取模块,被配置为获取关于决策主体对决策对象分析内容和需求的描述性语句;
分词模块,被配置为对所述描述性语句进行分词处理;
确定模块,被配置为确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数;
推荐模块,被配置为推荐数据分析模型。
根据本申请的另一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行如前所述的方法。
根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。
由以上本发明的技术方案,与现有技术相比,其显著的有益效果在于:通过决策主体对决策对象分析需求的描述性语句来匹配数据分析模型的方式,可以缩短工作人员选择数据分析模型的时间,精简匹配工作模式,提高工作效率。还能避开人工匹配过程中存在的个人主观性,从而提高匹配精准度,进而优化了对决策对象的分析结果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和有益效果将在下面的描述中显现,或通过根据本发明教导的具体实施方式的实践中得知。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的信息推荐方法的应用场景示意图;
图2是根据一示例性实施例示出的一种信息推荐方法的流程图;
图3是根据图2对应实施例示出的一实施例的步骤240的细节流程图;
图4是根据图2对应实施例示出的另一实施例的步骤240的细节流程图;
图5是根据图2对应实施例示出的另一实施例的步骤240的细节流程图;
图6是根据图2对应实施例示出的又一实施例的步骤240的细节流程图;
图7是根据一示例性实施例示出的一种信息推荐装置的框图;
图8是根据一示例性实施例示出的一种实现上述方法的电子设备示例框图;
图9是根据一示例性实施例示出的一种实现上述方法的计算机可读存储介质。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
本公开首先提供了一种信息推荐方法。在本发明中,所述信息具体是指一种数据分析模型,所述数据分析模型可以是指在计算机通信邻域中用于检测网络稳定性的“网络稳定性检测模型”,或者是用于检测网速的“网速检测模型”。再或者是用于检测网络安全的“网络安全检测模型”等等。
此外,所述数据分析模型还可以是在保险理赔业务中的用于评估理赔对象是否伪造理赔材料的“伪造理赔材料模型”,或者是用于评估理赔对象是否有不合理医疗行为的“不合理医疗行为模型”,再或者是在贷款业务中用于评估贷款对象信用的“信用评估模型”,还或者是用于评估贷款对象是否有恶意欠款迹象的“欠款恶意程度评估模型”等等。
本发明的实施环境可以是便携移动设备,例如智能手机、平板电脑、笔记本电脑等,也可以是各种固定式设备,例如,计算机设备、现场终端、台式电脑、服务器、工作站等。
图1是根据一示例性实施例示出的信息推荐方法的应用场景示意图。如图1所示,本发明采用了一个通过确定描述数据分析模型的关键词与决策主体对决策对象分析需求的描述性语句的匹配分数的方式来匹配满足决策主体分析需求的数据分析模型。首先将能体现决策主体分析需求的描述性语句转化为含有第二关键词的第二关键词表110,然后再与事先插入在数据分析模型120中的含有第一关键词的第一关键词表130进行匹配,得到匹配分数140。最后根据匹配分数来为决策主体推荐数据分析模型。
需要注意的是,在本发明中,所提及到的决策主体是指对决策对象有分析或者评估需求的对象主体,例如个人用户、专业公司以及评估机构等等。
图2是根据一示例性实施例示出的一种信息推荐的流程图。如图2所示,此方法包括以下步骤:
步骤210,获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表。
在本发明中,针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表获取方式可以有多种。例如,可以使用采集设备或者采集单元从其它数据分析系统中采集得到,也可以是通过运行爬虫程序从其它数据分析系统中爬取得到,还可以是通过数据的传输介质,读取或者接收工作人员发送的数据。还可以通过物理硬盘拷贝其它数据分析系统中各数据分析模型所对应的存有第一关键词的第一关键词表,或者是通过工作人员手动输入而得到。
在本发明中,必须为每一个数据分析模型配置一个存有第一关键词的第一关键词表。需要注意的是,所述第一关键词表中的第一关键词需要满足能全面概括和总结数据分析模型对应的分析功能的要求。且概括和总结数据分析模型对应的分析功能的第一关键词数量均为N个(N>1)。其中N越大,就越能详细的概括和总结数据分析模型对应的分析功能。
在一个实施例中,概括和总结数据分析模型对应的分析功能的第一关键词可以是独立的语义不相近的多个关键词。例如,对于数据分析系统中的信用评估模型,其主要用于对决策对象的信用进行一个评估,这里的决策对象可以是例如向银行贷款的贷款申请人、申领信用卡的申请人等等。所以,关于信用评估模型的第一关键词可以概括为4个:“贷款”、“信用”、“评分”、“约定”。
在另一个实施例中,概括和总结数据分析模型对应的分析功能的第一关键词还可以是独立的语义相近的多组关键词。例如,关于信用评估模型的第一关键词可以概括为8个:“贷款,借款”、“信用,信誉”、“评分,评价”、“约定,承诺”。还例如,对于数据分析系统中的伪造理赔材料模型,其第一关键词就可以概括为8个:“伪造,虚假”、“理赔,赔偿”、“故意,有意”、“打分,评分”。
在为数据分析系统中所有数据分析模型概括第一关键词之后,将不同数据分析模型对应的N个第一关键词以字段的形式存入不同的第一关键词表中,第一关键词表中的一个表格单元放入一个第一关键词,第一关键词表的表头写入有所对应数据分析模型的模型名称和模型在数据分析系统中的地址。
所述第一关键词表以电子表格的形式存在。所述电子表格的具体形式是可选择的,其中,电子表格可以是EXCEL表格,可以是WPS电子表,也可以是WORD中的表格,还可以是WORKS表格或者LOTUS123表格等等。
步骤220,获取关于决策主体对决策对象的分析内容和需求的描述性语句。在本发明中,关于决策主体对决策对象分析需求的描述性语句的获取方式可以有多种。例如,可以是通过数据的传输介质,读取或者接收工作人员发送的描述性语句数据。也可以通过物理硬盘拷贝得到描述性语句数据,还可以通过工作人员手动输入关于决策主体对决策对象分析需求的描述性语句而得到。
所述决策主体对决策对象分析需求的描述性语句可以是基于事先获得的与决策主体关于对决策对象分析需求的访谈记录,得到的关于所述分析需求的描述性语句。例如,在贷款时,决策主体(银行)期望在贷前申请环节对决策对象的信用进行一个评价,因此通过访谈记录,可以得到关于该决策主体对决策对象分析评估要求的描述性语句:“×××用户正在向我行申请贷款,目前我行掌握有关于该用户的……信息数据材料,因此我行委托贵方基于所述信息数据材料对该用户的信用进行一个评价,并以评价报告的形式反馈于我行,以便于我行了解该用户的信用情况”。
步骤230,对所述描述性语句进行分词处理,以得到存有第二关键词的第二关键词表。
所述第二关键词表也以电子表格的形式存在。所述电子表格的具体形式是可选择的,其中,电子表格可以是EXCEL表格,可以是WPS电子表,也可以是WORD中的表格,还可以是WORKS表格或者LOTUS123表格等等。
对所述描述性语句进行分词处理的方式有多种,具体如下:
在一个实施例中,所述对所述描述性语句进行的分词处理可以是通过机械分词法来完成的。所述机械分词法是一种基于词典的方法,是将文档中的字符串与词典中的词条一一匹配,如果在词典中找到了某个字符串,则匹配成功,可以切分,否则不予切分。例如,对于上述举例中关于“×××用户正在向我行申请贷款,目前我行掌握有关于该用户的……信息数据材料,因此我行委托贵方基于所述信息数据材料对该用户的信用进行一个评价,并以评价报告的形式反馈于我行,以便于我行了解该用户的信用情况”的描述性语句进行机械分词会得到:““×××”、“用户”、“正在”、“向”、“我行”、“申请”、“贷款”、“目前”、“我行”、“掌握”、“有”、“关于”、“该”、“用户”、“的”、“……”、“信息”、“数据”、“材料”、“因此”、“我行”、“委托”、“贵方”、“基于”、“所述”、“信息”、“数据”、“材料”、“对”、“该”、“用户”、“的”、“信用”、“进行”、“一个”、“评价”、“并”、“以”、“评价”、“报告”、“的”、“形式”、“反馈”、“于”、“我行”、“以便于”、“我行”、“了解”、“该”、“用户”、“的”、“信用”、“情况””。在完成分词之后,将这些词语作为第二关键词存入第二关键词表,每一个第二关键词占据一个表格单元。本实施例的好处在于,通过机械分词法进行分词可以提高分词的速度和准确性。
在一个实施例中,所述对所述描述性语句进行的分词处理可以是通过语法和规则的分词方法来完成的。其主要是通过在分词的同时进行句法和语义分析,通过句法和语义信息来标注词性,并以词性的不同来进行分词。
在一个实施例中,所述对所述描述性语句进行的分词处理可以是通过统计的分词法来完成的。其主要根据字符串在语料中出现的统计词频来判断其是否构成一个词。词是字的组合,相邻的字同时出现的次数越多越有可能成为一个词。随着时代与互联网的发展,会产生很多新的词汇,例如一些人名、新科技名词、新事件名称。
如上所述,可以理解的是,对所述描述性语句进行分词处理的方式可以是任意的,并不限于如上所示出的那些。
步骤240,基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
在一个实施例中,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数可以通过如下方式完成:
如图3是根据图2对应实施例示出的一实施例的步骤240的细节流程图,具体包括以下步骤:
步骤2401,分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词。
具体的,根据数据分析系统中一个数据分析模型的地址找到该数据分析模型所对应的第一关键词表,并从第一关键词表中取出第一关键词与第二关键词表中的第二关键词进行对比,若第一关键词表中的某个关键词与第二关键词表中的某个关键词相同,则将该第一关键词确定为交集关键词。
步骤2402,计数所述交集关键词的个数,将所述计数的交集关键词的个数作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
在对所有数据分析模型所对应第一关键词表中的关键词对比完成之后,将各数据分析模型所对应第一关键词表中被确定的交集关键词的个数作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
在一个实施例中,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数也可以通过如下方式完成:
如图4是根据图2对应实施例示出的另一实施例的步骤240的细节流程图,具体包括以下步骤:
步骤2401,分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词。
步骤2403,标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
标注所述交集关键词在所述描述性语句中的重复次数。具体的,例如,所述描述性语句为“×××用户正在向我行申请贷款,目前我行掌握有关于该用户的……信息数据材料,因此我行委托贵方基于所述信息数据材料对该用户的信用进行一个评价,并以评价报告的形式反馈于我行,以便于我行了解该用户的信用情况”,所述被确定的一个交集关键词为“信用”。那么可见,在所述交集关键词“信用”上标注的在所述描述性语句中的重复次数就为2次。
将所有交集关键词上标注的重复次数的和作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。具体的,例如,在信用评估模型中被确定的交集关键词和所述交集关键词上被标注的在所述描述性语句中的重复次数分别为:“贷款,3次”、“信用,2次”、“评分,1次”、“约定,3次”,那么,所述所有交集关键词上标注的重复次数的和就为:3+2+1+3=9次,即所述信用评估模型对应的第一关键词与所述第二关键词的匹配分数就为9。
在一个实施例中,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数还可以通过如下方式完成:
如图5是根据图2对应实施例示出的另一实施例的步骤240的细节流程图,具体包括以下步骤:
步骤2401,分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词。
步骤2402,计数所述交集关键词的个数,将所述计数的交集关键词的个数作为所述各个数据分析模型对应的第一关键词与所述第二关键词的第一匹配分数。
步骤2403,标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为所述各个数据分析模型对应的第一关键词与所述第二关键词的第二匹配分数。
步骤2404,将所述第一匹配分数与第二匹配分数的加权和作为各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
在对所述第一匹配分数和第二匹配分数的加权和计算过程中,第一匹配分数和第二匹配分数的权重有多种选择,其中,可以设置第一匹配分数的权重为0.4,第二匹配分数的权重为0.6,也可以将第一匹配分数的权重设置为0.7,第二匹配分数的权重设置为0.3,设置要求只需要满足第一匹配分数的权重与第二匹配分数的权重之和等于1即可。
具体的,例如,第一匹配分数为4,其权重为0.3,第二匹配分数为10,其权重为0.7,那么匹配分数则为:
0.3×4+0.7×10=8.2
在一个实施例中,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数还可以通过如下方式完成:
如图6是根据图2对应实施例示出的又一实施例的步骤240的细节流程图,具体包括以下步骤:
步骤2401,分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词。
步骤2402,计数所述交集关键词的个数,将所述计数的交集关键词的个数作为各个数据分析模型对应的第一关键词与所述第二关键词的第一匹配分数。
步骤2403,标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为各个数据分析模型对应的第一关键词与所述第二关键词的第二匹配分数。
步骤2405,获取各个数据分析模型在历史上被所述决策主体使用过的次数,将各个数据分析模型在历史上被所述决策主体使用过的次数作为第三匹配分数。
所述各个数据分析模型在历史上被所述决策主体使用过的次数可以从针对所述决策主体委托的业务的处理记录中统计得到。例如,在历史上有10次通过“伪造理赔材料模型”来为保险公司分析评估过理赔对象的伪造理赔材料可能性,还有20次通过“不合理医疗行为模型”来为保险公司分析评估过理赔对象有不合理医疗行为可能性。
步骤2406,将所述第一匹配分数、第二匹配分数和第三匹配分数的加权和作为各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
在对所述第一匹配分数、第二匹配分数和第三匹配分数的加权和计算过程中,第一匹配分数、第二匹配分数和第三匹配分数的权重有多种选择,其中,可以设置第一匹配分数的权重为0.2,第二匹配分数的权重为0.4,第三匹配分数的权重为0.4,也可以将第一匹配分数的权重设置为0.1,第二匹配分数的权重设置为0.3,第三匹配分数的权重为0.6。设置要求只需要满足第一匹配分数的权重、第二匹配分数的权重、第三匹配分数的权重之和等于1即可。
具体的,例如,第一匹配分数为4,其权重为0.3,第二匹配分数为10,其权重为0.5,第三匹配分数为20,其权重为0.2,那么匹配分数则为:
0.3×4+0.5×10+0.2×20=10.2
如上所述的实施例的好处在于,通过考虑不同的方面来为第二关键词与第一关键词确定匹配分数,从而确定推荐的数据分析模型,可以使推荐的数据分析模型更准确,更符合决策主体的关于科学分析决策对象的要求。
如上所述,可以理解的是,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数的方式可以是任意的,并不限于如上所示出的那些。
步骤250,基于所述确定的匹配分数,推荐数据分析模型。
在一个实施例中,所述推荐的数据分析模型可以是所述匹配分数最高的数据分析模型。
在一个实施例中,所述推荐的数据分析模型也可以是所述匹配分数前N名的数据分析模型,其中N是大于1的正整数。本实施例的好处在于,通过控制N的大小可以控制数据分析模型的推荐数量,可以防止推荐的数据分析模型数量过多而导致的工作人员在选择数据分析模型时不准确的问题。
在一个实施例中,所述推荐的数据分析模型还可以是所述匹配分数超过预定阈值的数据分析模型。本实施例的好处在于,通过控制阈值的大小也可以控制数据分析模型的推荐数量,可以防止推荐的数据分析模型数量过多而导致的工作人员在选择数据分析模型时不准确的问题。
如上所述,可以理解的是,基于所述确定的匹配分数,推荐数据分析模型的方式可以是任意的,并不限于如上所示出的那些。
综上所述,通过决策主体对决策对象分析需求的描述性语句来匹配数据分析模型方式,可以缩短工作人员选择数据分析模型的时间,精简匹配工作模式,提高工作效率。还能避开人工匹配过程中存在的个人主观性,从而提高匹配精准度,进而优化了对决策对象的分析结果。
以下是本发明的装置实施例。
本公开还提供了一种信息推荐装置。图7是根据一示例性实施例示出的一种信息推荐装置的框图。如图7所示,装置700包括:
第一获取模块710,被配置为获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;
第二获取模块720,被配置为获取关于决策主体对决策对象分析内容和需求的描述性语句;
分词模块730,被配置为对所述描述性语句进行分词处理;
确定模块740,被配置为确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数;
推荐模块750,被配置为推荐数据分析模型。
据本公开的第三方面,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述根据本发明的这种实施方式的电子设备1000。图8显示的电子设备1000仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备1000以通用计算设备的形式表现。电子设备1000的组件可以包括但不限于:上述至少一个处理单元1010、上述至少一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元1010)的总线1030。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元1010执行,使得所述处理单元1010执行本说明书上述“实施例方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元1020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)1021和/或高速缓存存储单元1022,还可以进一步包括只读存储单元(ROM)1023。
存储单元1020还可以包括具有一组(至少一个)程序模块1025的程序/实用工具1024,这样的程序模块1025包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备1000也可以与一个或多个外部设备1200(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且,电子设备1000还可以通过网络适配器1060与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1060通过总线1030与电子设备1000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
根据本公开的第四方面,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图9所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种信息推荐方法,其特征在于,包括:
获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;
获取关于决策主体对决策对象的分析内容和需求的描述性语句;
对所述描述性语句进行分词处理,以得到存有第二关键词的第二关键词表;
基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数;
基于所述确定的匹配分数,推荐数据分析模型。
2.根据权利要求1所述的方法,其特征在于,所述对描述性语句进行分词处理是通过机械分词法来完成的。
3.根据权利要求1所述的方法,其特征在于,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数,包括:
分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词;
计数所述交集关键词的个数,将所述计数的交集关键词的个数作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数,包括:
分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词;
标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数,包括:
分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词;
计数所述交集关键词的个数,将所述计数的交集关键词的个数作为所述各个数据分析模型对应的第一关键词与所述第二关键词的第一匹配分数;
标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为所述各个数据分析模型对应的第一关键词与所述第二关键词的第二匹配分数;
将所述第一匹配分数与第二匹配分数的加权和作为各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
6.根据权利要求1所述的方法,其特征在于,所述基于所述第二关键词表中的第二关键词,确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数,包括:
分别对各个数据分析模型对应的第一关键词与所述第二关键词进行交集处理,以确定各个数据分析模型对应的交集关键词;
计数所述交集关键词的个数,将所述计数的交集关键词的个数作为各个数据分析模型对应的第一关键词与所述第二关键词的第一匹配分数;
标注所述交集关键词在所述描述性语句中的重复次数,将所有交集关键词上标注的重复次数的和作为各个数据分析模型对应的第一关键词与所述第二关键词的第二匹配分数;
获取各个数据分析模型在历史上被所述决策主体使用过的次数,将各个数据分析模型在历史上被所述决策主体使用过的次数作为第三匹配分数;
将所述第一匹配分数、第二匹配分数和第三匹配分数的加权和作为各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数。
7.根据权利要求1所述的方法,其特征在于,所述推荐的数据分析模型是所述匹配分数前N名的数据分析模型,其中N是大于0的正整数。
8.一种信息推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取针对数据分析系统中各个数据分析模型而配置的存有第一关键词的第一关键词表;
第二获取模块,用于获取关于决策主体对决策对象的分析内容和需求的描述性语句;
分词模块,用于对所述描述性语句进行分词处理;
确定模块,用于确定所述各个数据分析模型对应的第一关键词与所述第二关键词的匹配分数;
推荐模块,用于推荐数据分析模型。
9.一种计算机可读程序介质,其特征在于,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行根据权利要求1至7中任一项所述的方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321476.8A CN110147887A (zh) | 2019-04-19 | 2019-04-19 | 信息推荐方法、装置、介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910321476.8A CN110147887A (zh) | 2019-04-19 | 2019-04-19 | 信息推荐方法、装置、介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110147887A true CN110147887A (zh) | 2019-08-20 |
Family
ID=67589781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910321476.8A Pending CN110147887A (zh) | 2019-04-19 | 2019-04-19 | 信息推荐方法、装置、介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110147887A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363821A1 (en) * | 2013-11-20 | 2015-12-17 | Google Inc. | Keyword recommendations based on organic keyword analysis |
WO2017000513A1 (zh) * | 2015-06-30 | 2017-01-05 | 百度在线网络技术(北京)有限公司 | 一种基于用户搜索行为的信息推送方法、装置、存储介质和设备 |
CN106709017A (zh) * | 2016-12-27 | 2017-05-24 | 山东麦港数据系统有限公司 | 一种基于大数据的辅助决策方法 |
CN107590130A (zh) * | 2017-09-30 | 2018-01-16 | 北京三快在线科技有限公司 | 场景确定方法及装置、存储介质和电子设备 |
CN108345686A (zh) * | 2018-03-08 | 2018-07-31 | 广州赫炎大数据科技有限公司 | 一种基于搜索引擎技术的数据分析方法及系统 |
CN109241456A (zh) * | 2018-09-13 | 2019-01-18 | 上海宇佑船舶科技有限公司 | 地点推荐方法、装置及服务器 |
CN109255013A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 理赔决策方法、装置、计算机设备和存储介质 |
CN109635198A (zh) * | 2018-12-17 | 2019-04-16 | 杭州柚子街信息科技有限公司 | 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备 |
-
2019
- 2019-04-19 CN CN201910321476.8A patent/CN110147887A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363821A1 (en) * | 2013-11-20 | 2015-12-17 | Google Inc. | Keyword recommendations based on organic keyword analysis |
WO2017000513A1 (zh) * | 2015-06-30 | 2017-01-05 | 百度在线网络技术(北京)有限公司 | 一种基于用户搜索行为的信息推送方法、装置、存储介质和设备 |
CN106709017A (zh) * | 2016-12-27 | 2017-05-24 | 山东麦港数据系统有限公司 | 一种基于大数据的辅助决策方法 |
CN107590130A (zh) * | 2017-09-30 | 2018-01-16 | 北京三快在线科技有限公司 | 场景确定方法及装置、存储介质和电子设备 |
CN108345686A (zh) * | 2018-03-08 | 2018-07-31 | 广州赫炎大数据科技有限公司 | 一种基于搜索引擎技术的数据分析方法及系统 |
CN109255013A (zh) * | 2018-08-14 | 2019-01-22 | 平安医疗健康管理股份有限公司 | 理赔决策方法、装置、计算机设备和存储介质 |
CN109241456A (zh) * | 2018-09-13 | 2019-01-18 | 上海宇佑船舶科技有限公司 | 地点推荐方法、装置及服务器 |
CN109635198A (zh) * | 2018-12-17 | 2019-04-16 | 杭州柚子街信息科技有限公司 | 在商品展示平台上呈现用户搜索结果的方法、装置、介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112347310B (zh) | 事件处理信息的查询方法、装置、计算机设备和存储介质 | |
CN108959246A (zh) | 基于改进的注意力机制的答案选择方法、装置和电子设备 | |
CN107704512A (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
CN112988963B (zh) | 基于多流程节点的用户意图预测方法、装置、设备及介质 | |
WO2022048363A1 (zh) | 网站分类方法、装置、计算机设备及存储介质 | |
CN112686022A (zh) | 违规语料的检测方法、装置、计算机设备及存储介质 | |
CN110111139A (zh) | 行为预估模型生成方法、装置、电子设备及可读介质 | |
CN110263157A (zh) | 一种数据风险预测方法、装置及设备 | |
CN112395391B (zh) | 概念图谱构建方法、装置、计算机设备及存储介质 | |
CN115357719B (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
CN113220999B (zh) | 用户特征的生成方法、装置、电子设备和存储介质 | |
WO2021174829A1 (zh) | 众包任务的抽检方法、装置、计算机设备及存储介质 | |
CN113626576A (zh) | 远程监督中关系特征抽取方法、装置、终端及存储介质 | |
CN110688540A (zh) | 一种作弊账户筛选方法、装置、设备及介质 | |
CN114092948A (zh) | 一种票据识别方法、装置、设备以及存储介质 | |
EP4270239A1 (en) | Supervised machine learning method for matching unsupervised data | |
CN116304043A (zh) | 一种低资源条件下的文本分类方法及装置 | |
EP3923230A1 (en) | Method and apparatus for processing risk-management feature factors, electronic device and storage medium | |
WO2022048535A1 (en) | Reasoning based natural language interpretation | |
CN112668315B (zh) | 一种文本自动生成方法、系统、终端及存储介质 | |
KR20230169538A (ko) | 금융 마이데이터 기반 기계학습을 위한 말뭉치를 이용한 거래 적요 데이터 분석 장치 및 방법과 이를 위한 컴퓨터 프로그램 | |
CN110147887A (zh) | 信息推荐方法、装置、介质、电子设备 | |
US11507864B2 (en) | Computerized method of training a computer executed model for recognizing numerical quantities | |
CN113051396A (zh) | 文档的分类识别方法、装置和电子设备 | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190820 |