CN112100216A - 创意关键词的处理方法和装置 - Google Patents
创意关键词的处理方法和装置 Download PDFInfo
- Publication number
- CN112100216A CN112100216A CN202010983469.7A CN202010983469A CN112100216A CN 112100216 A CN112100216 A CN 112100216A CN 202010983469 A CN202010983469 A CN 202010983469A CN 112100216 A CN112100216 A CN 112100216A
- Authority
- CN
- China
- Prior art keywords
- creative
- search
- keywords
- keyword
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000000034 method Methods 0.000 claims abstract description 52
- 230000001960 triggered effect Effects 0.000 claims abstract description 39
- 238000012545 processing Methods 0.000 claims abstract description 29
- 238000012163 sequencing technique Methods 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims description 38
- 238000012216 screening Methods 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 239000000463 material Substances 0.000 claims description 5
- 230000000694 effects Effects 0.000 description 44
- 239000000047 product Substances 0.000 description 35
- 238000007726 management method Methods 0.000 description 30
- 230000008520 organization Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种创意关键词的处理方法和装置,涉及计算机技术领域。该创意关键词的处理方法的一具体实施方式包括:接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。该实施方式可以实现全局模糊搜索,可以解决现有搜索方式搜索质量不高的问题。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种创意关键词的处理方法和装置。
背景技术
一般地,创意统筹管理处于创新管理流程的前端,只有注重创新机会的识别和分析、创意的产生和丰富以及创意的选择和审核,才能与后续的实施转化和面市推广等环节有效衔接,才能真正拓展创新源头,并形成创新闭环。为了能够搜索到满足要求的创意,现有搜索方式大多是根据选定字段进行搜索,搜索得到的内容数量多且质量不高,不便于创意统筹管理。
发明内容
有鉴于此,本发明实施例提供一种创意关键词的处理方法和装置,能够解决现有搜索方式搜索质量不高的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种创意关键词的处理方法。
本发明实施例的创意关键词的处理方法包括:
接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;
根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;
从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
可选地,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重包括:
当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0;
按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子;
将所述创意关键词的权重值与权重因子的乘积,确定为所述创意关键词的搜索权重。
可选地,从所述关系队列中选取要展示的创意关键词包括:
从所述关系队列中随机选取预设数量的创意关键词,作为要展示的创意关键词;
或者,从所述关系队列的队首选取预设数量的创意关键词,作为要展示的创意关键词,所述关系队列中的所述创意关键词的搜索权重从大到小排列。
可选地,在接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤之前,所述方法还包括:
接收用户触发的搜索请求,确定所述用户的岗位属性和所属的机构编号;
根据所述用户的岗位属性和所属的机构编号以及预设的岗位属性、机构编号与搜索范围的对应关系,确定所述用户的搜索范围;
若所述搜索请求符合所述用户的搜索范围,则执行根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤;
否则,拒绝所述用户的搜索请求。
可选地,根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列的步骤之后,所述方法还包括:
根据用户触发的配置操作,在所述创意关键词的关系队列中增加和/或删除创意关键词。
可选地,在接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤之前,所述方法包括:
获取创意预料库中待提取的创意文本;
确定所述创意文本中指定词性的单词的词频TF值;
确定所述指定词性的单词对应的逆向文件频率IDF值;
计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词。
可选地,根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词包括:
将所述创意文本中指定词性的单词按照TF-IDF值由大到小排序,从队首选取第一预设数量的指定词性的单词作为所述创意文本的创意关键词。
可选地,确定所述创意文本中指定词性的单词的词频TF值之前,所述方法还包括:
将所述创意文本按照句子进行分割;
将每个句子进行分词和词性标注处理;
根据所述每个句子的分词结果以及词性标注结果,从每个句子中筛选出指定词性的单词。
可选地,在计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词的步骤之后,所述方法还包括:
接收用户触发的生成相似度报告的请求,所述请求指示了创意编号以及对比库范围;
获取所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词;
根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本;
根据与所述创意编号的创意文本的相似度在预设范围内的其他创意文本,生成相似度报告。
可选地,根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本包括:
将所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词合并成一个预料集合;
计算所述创意编号的创意文本在所述预料集合中的词频;
根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度;
确定与所述创意编号的创意文本的相似度在预设范围的其他创意文本。
可选地,根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度包括:
根据所述创意编号的创意文本在所述预料集合中的词频,生成所述创意编号的创意文本的词频向量;
根据所述创意编号的创意文本的词频向量,计算其他创意文本与所述创意编号的创意文本的相似度。
可选地,所述相似度为余弦相似度。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种创意关键词的处理装置。
本发明实施例的创意关键词的处理装置包括:
第一确定模块,用于接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;
第二确定模块,用于根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;
展示模块,用于从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备。
本发明实施例的电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的方法。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种计算机可读介质。
本发明实施例的计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:
在本发明实施例中,根据用户触发的搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,该关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以提高搜索质量,可以解决现有搜索方式搜索质量不高的问题。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明第一实施例的创意关键词的处理方法的流程示意图;
图2是本发明第二实施例的创意关键词的处理方法的流程示意图;
图3是本发明第三实施例的创意关键词的处理方法的流程示意图;
图4是本发明实施例的创意关键词的处理装置的模块示意图;
图5是本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本发明第一实施例的创意关键词的处理方法的流程示意图,如图1所示,该创意关键词的处理方法可以包括如下的步骤S101至步骤S103。
步骤S101:接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重。
在步骤S101中,所述搜索请求是指用于获取创意文本的创意关键词的请求。所述创意关键词是从创意文本中提取得到的,所述创意文本是指与创意有关的文章或句子等,所述创意文本可以以列表形式存储在数据库中,如表5至表12所示。所述搜索范围可以理解为允许用户搜索的范围,可以以部门或公司等为单位设置搜索范围,并且可以为不同岗位属性的用户设置不同的搜索范围。所述创意关键词的搜索次数可以理解为在预设时间范围内所述创意关键词被搜索的次数。所述创意关键词的权重因子与时间有关,可以将权重因子设置为在预设时间范围内随着时间的增加而衰减。
其中,确定创意关键词的搜索权重的过程大致为:当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0,例如:N=1。然后按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子。最终将所述创意关键词的权重值与权重因子的乘积,确定为所述创意关键词的搜索权重。
由于不同岗位属性的用户会设置不同的搜索范围,为了判断用户的搜索请求是否符合搜索范围,在步骤S101之前,所述方法还包括:接收用户触发的搜索请求,首先确定所述用户的岗位属性和所属的机构编号,例如:可以根据表1所示的用户属性表确定所述用户的岗位属性和所属的机构编号,所述岗位属性可以理解为用户的岗位角色。然后根据所述用户的岗位属性和所属的机构编号以及预设的岗位属性、机构编号与搜索范围的对应关系,确定所述用户的搜索范围。若所述搜索请求符合所述用户的搜索范围,则执行根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤;否则,拒绝所述用户的搜索请求。
表1用户属性表
字段名 | 字段含义 |
员工编号 | 用户的唯一性编号 |
员工姓名 | 员工编号所对应的员工姓名 |
机构编号 | 员工所在的机构 |
所属一级分行机构编号 | 员工所在的所属一级分行 |
所属二级分行机构编号 | 员工所在的所属二级分行 |
所属三级机构编号 | 员工所在的所属三级分行 |
机构核算层级代码 | 员工所在的机构层级 |
在确定用户的搜索范围时,可以根据表3所示的产品创意搜索热词表以及表4所示的产品创意活动定义表,确定用户的搜索范围。将表2至表4作为数据模板,确定总行、一级分行以及二级分行中不同部门的用户的搜索范围为例,对确定用户的搜索范围的过程进行示例性说明。其中,确定用户的搜索范围的过程大致分为以下几种情形:
情形一:
当用户的岗位属性为创意提出岗,则用户的搜索范围可以为:
1)分行用户搜索本分行内部创意;在客户端获取该用户的岗位属性和所属机构编号,若一级分行机构编号不为空,二级分行机构编号为空,则根据表2中所属一级分行机构编号与分行用户的所属机构编号筛选出本分行内部创意列表。
2)总行用户搜索全行范围内的创意;在客户端获取该用户的岗位属性和所属机构编号,若所属的一级分行机构编号为空,则为总行员工,查询所有的创意列表。
3)搜索“是否众创”标志为“是”的创意;根据表2中的众创标志筛选。
4)二级分行用户需要过滤掉其他二级分行的创意。在客户端获取该用户的岗位属性和所属机构编号,若一级分行机构编号与二级分行机构编号都不为空,则根据表2中所属一级分行机构编号与所属二级分行机构编号与分行用户的所属机构编号筛选出该用户所属的二级分行内部创意。
情形二:
当用户的岗位属性为创意主管岗,则用户的搜索范围可以为:
1)二级分行管理岗、主管岗搜索本二级分行机构的创意;在客户端获取该用户的岗位属性和所属机构编号,若一级分行机构编号与二级分行机构编号都不为空,则根据表2中所属一级分行机构编号与所属二级分行机构编号与分行用户的所属机构编号筛选出该用户所属的二级分行内部创意。
2)一级分行管理岗、主管岗搜索本部门牵头的创意活动下的创意,同时可以按照活动搜索,不过滤掉“是否众创”标志为“是”创意。在客户端获取该用户的岗位角色和所属机构号,根据表3中牵头部门编号筛选出本部门牵头的创意活动,根据表4的产品创意活动编号筛选出本部门牵头的创意活动的创意。
情形三:
类似地,当用户的岗位属性为综合管理岗,则用户的搜索范围可以为:
1)二级分行综合管理岗搜索本二级分行的创意;
2)一级分行综合管理岗搜索本一级分行下的全部创意;
3)总行创新综合管理岗搜索全行范围内的创意,同时也支持按照总分行机构搜索。
表2产品创意表
表3产品创意搜索热词表
表4产品创意活动定义表
字段名 | 字段含义 |
产品创意活动编号 | 创意活动的唯一性编码 |
员工编号 | 对应用户表的员工编号 |
员工姓名 | 员工编号所对应的员工姓名 |
产品创意活动名称 | 定义创意活动的名称 |
产品创意活动描述 | 创意活动的介绍或描述说明 |
生命周期状态代码 | 创意活动的状态代码 |
起始日期 | 创意活动的开始时间 |
结束日期 | 创意活动的截止时间 |
提交分行截止日期 | 分行创意提交到总行的截止时间 |
方案牵头机构编号 | 创意活动的发起部门编号 |
牵头部门编号 | 总行活动到分行负责人的部门编号 |
模板编号 | 创意模板定义表中的模板编号 |
步骤S102:根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系。
在步骤S102中,可以在所述搜索范围内按照搜索权重值从大到小或从小到大的顺序形成所述创意关键词的关系队列。
在步骤S102之后,为了根据实际需求在关系队列中增加和/或删除创意关键词,可以根据用户触发的配置操作,在所述创意关键词的关系队列中增加和/或删除创意关键词。
步骤S103:从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
在步骤S103中,可以从所述关系队列中随机选取预设数量的创意关键词,作为要展示的创意关键词。或者,可以从所述关系队列的队首选取预设数量的创意关键词,作为要展示的创意关键词,所述关系队列中的所述创意关键词的搜索权重从大到小排列。例如:默认展示排名前10的关键词,也可以点击换一换,在前100的关键词中随机展示10个。
在本发明实施例中,根据用户触发的搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,所述关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以精准化地匹配创意,可以解决现有搜索方式搜索质量不高的问题。
同时,该实施方式可以展示个人所有创意关键词,能够对创意关键词置顶,能够针对创意关键词查看创意详情及创意审批状态。该实施方式可以通过总行与分行的不同部门的权限配置,实现创意库的总行与分行不同活动的创意关键词的查询权限可配置化,分行活动的创意关键词查询相互隔离,也可授予其他分行查询权限。
在创意数量较多时,现有实施方式缺乏主题聚焦和整合。为了解决该问题,本发明实施例还提供了另一种创意关键词的处理方法,图2是本发明第二实施例的创意关键词的处理方法的流程示意图,如图2所示,该创意关键词的处理方法可以包括如下的步骤S201至步骤S208。
步骤S201:获取创意预料库中待提取的创意文本。
在S201中,创意语料库由根据简单模板、标准模板、完整模板、马拉松模板创建的创意构成,将表8中各模板对应的创意属性创客填写内容整合至产品创意的产品创意描述中,由创意活动编号来标识创意预料库的创意分类,由产品创意编号来标识创意语料库的特定创意。产品创意描述为创意关键词抽取的语料文本。各个分行有独立的创意语料库。可以理解的是,所述创意文本是指与创意有关的文章或句子等,所述创意文本可以以列表形式存储在数据库中,如表5至表12所示。
在步骤S201之后且在步骤S202之前,需要从所述每个句子中筛选出指定词性的单词,筛选过程大致为:首先将所述创意文本按照句子进行分割。然后再将每个句子进行分词和词性标注处理。最后根据所述每个句子的分词结果以及词性标注结果,从每个句子中筛选出指定词性的单词。
其中,可以通过表11和表12,根据创意编号筛选出该产品创意内容,并通过键值对存储至数据库(例如:ElasticSearch)中,以便于通过步骤S201获取创意预料库中待提取的创意文本。
表5产品创意表
表6产品创意活动
字段名 | 字段含义 |
产品创意活动编号 | 创意活动的唯一性编码 |
员工编号 | 对应用户表的员工编号 |
员工姓名 | 员工编号所对应的员工姓名 |
产品创意活动名称 | 定义创意活动的名称 |
产品创意活动描述 | 创意活动的介绍或描述说明 |
生命周期状态代码 | 创意活动的状态代码 |
起始日期 | 创意活动的开始时间 |
结束日期 | 创意活动的截止时间 |
提交分行截止日期 | 分行创意提交到总行的截止时间 |
方案牵头机构编号 | 创意活动的发起部门编号 |
牵头部门编号 | 总行活动到分行负责人的部门编号 |
模板编号 | 创意模板定义表中的模板编号 |
创意活动关键词 | 创意活动抽取的关键词 |
表7创意模板定义表
字段名 | 字段含义 |
模板编号 | 确定模板相关信息的唯一性 |
模板名称 | 定义模板名称 |
简介 | 模板信息相关说明及介绍 |
模板类型 | 基础模板是模板定义的 |
表8创意属性表
表9创意属性关系表
字段名 | 字段含义 |
模板编号 | 创意模板定义表中的模板编号 |
属性编号 | 创意属性表中的属性编号 |
显示顺序 | 模板中属性的排列顺序的数据编码 |
产品属性值非空标志 | 模板属性是否为空的数据类型 |
产品属性值多选标志 | 模板属性单选或多选的数据类型 |
表10参数表
字段名 | 字段含义 |
参数类型代码 | 创意属性表中的域编号 |
参数名称 | 参数类型代码对应的名称 |
属性英文名 | 参数类型代码对应的英文名称 |
参数值 | 参数显示的顺序的数据编码 |
表11创意列表值表
字段名 | 字段含义 |
创意编号 | 产品创意表的创意编号 |
属性编号 | 创意属性表中的属性编号 |
参数类型代码 | 参数表中对应的参数类型代码 |
参数值 | 参数类型代码对应的参数值 |
代码中文名称 | 该属性参数的中文名称 |
代码英文名称 | 该属性参数的英文名称 |
表12创意文本值表
字段名 | 字段含义 |
创意编号 | 产品创意表中对应的创意编号 |
属性编号 | 创意属性表中对应的属性编号 |
产品属性文本值 | 产品属性对应的文本输入框名称 |
产品属性日期值 | 产品属性对应的日期输入框名称 |
产品属性数量值 | 产品属性对应的数量输入框名称 |
步骤S202:确定所述创意文本中指定词性的单词的词频(TF)值。
在步骤202中,统计创意预料库中创意文本的总词数,并过滤掉停用词,只保留指定词性的单词,如名词、动词或形容词。并统计指定词性的单词出现次数,以计算TF值。
步骤S203:确定所述指定词性的单词对应的逆向文件频率(IDF)值。
在步骤S203中,在文件集里,统计创意预料库中出现的文件数,计算IDF值。
步骤S204:计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词。
在步骤S204中,可以将所述创意文本中指定词性的单词按照TF-IDF值由大到小排序,从队首选取第一预设数量的指定词性的单词作为所述创意文本的创意关键词。
步骤S205:接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重。
在步骤S205中,确定创意关键词的搜索权重的过程大致为:当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0,例如:N=1。然后按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子。最终将所述创意关键词的权重值与权重因子乘积,确定为所述创意关键词的搜索权重。
步骤S206:根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系。
步骤S207:根据用户触发的配置操作,在所述创意关键词的关系队列中增加和/或删除创意关键词。
例如:总行、一级分行创意综合管理岗可以对该机构的排名前100创意关键词进行新增、删除。
步骤S208:从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
需要说明的是,步骤S208的实施原理与步骤S103相同,相同之处不再赘述。
例如,可以对关系队列进行重检,保留搜索权重前100的创意关键词在关系队列中;智能创意搜索库默认展示排名前10的创意关键词。也可以点击换一换,在前100的创意关键词中随机展示10个。
在本发明实施例中,从创意文本中提取创意关键词,在接收到用户触发的搜索请求,根据该搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,所述关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以提高搜索质量,可以解决现有搜索方式搜索质量不高的问题。
可以理解的是,该实施方式可以从创意活动管理中的活动内容进行关键词抽取,进行创意活动热门关键词展示,对于活动热门关键字点赞、留言。该实施方式实现了创意库中存量的创意的关键词提取与增量创意的关键词提取。
由于现有实施方式在创意筛选整合流程中全依赖人工,无法对相似创意提供机器筛选以及整合功能。为了解决该问题,本发明实施例还提供了又一种关键词的处理方法,图3是本发明第三实施例的创意关键词的处理方法的流程示意图,如图3所示,该创意关键词的处理方法可以包括如下的步骤S301至步骤S314。
步骤S301:获取创意预料库中待提取的创意文本。
在步骤S301之后且在步骤S302之前,需要从所述每个句子中筛选出指定词性的单词,筛选过程大致为:首先将所述创意文本按照句子进行分割。然后再将每个句子进行分词和词性标注处理。最后根据所述每个句子的分词结果以及词性标注结果,从每个句子中筛选出指定词性的单词。
需要说明的是,步骤S301的实施原理与步骤S201相同,相同之处不再赘述。
步骤S302:确定所述创意文本中指定词性的单词的词频(TF)值。
需要说明的是,步骤S302的实施原理与步骤S202相同,相同之处不再赘述。
步骤S303:确定所述指定词性的单词对应的逆向文件频率(IDF)值。
需要说明的是,步骤S303的实施原理与步骤S203相同,相同之处不再赘述。
步骤S304:计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词。然后执行步骤S305或步骤S311。
在步骤S304中,可以将所述创意文本中指定词性的单词按照TF-IDF值由大到小排序,从队首选取第一预设数量的指定词性的单词作为所述创意文本的创意关键词。
需要说明的是,步骤S304的实施原理与步骤S204相同,相同之处不再赘述。
步骤S305:接收用户触发的搜索请求,确定所述用户的岗位属性和所属的机构编号。
在步骤S305中,可以根据表1所示的用户属性表确定所述用户的岗位属性和所属的机构编号,所述岗位属性可以理解为用户的岗位角色。
步骤S306:根据所述用户的岗位属性和所属的机构编号以及预设的岗位属性、机构编号与搜索范围的对应关系,确定所述用户的搜索范围;若所述搜索请求符合所述用户的搜索范围,则执行步骤S308;否则,执行步骤S307。
需要说明的是,步骤S306的实施原理与步骤S101中有关搜索范围处相同,相同之处不再赘述。
步骤S307:拒绝所述用户的搜索请求。
步骤S308:根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重。
在步骤S308中,所述搜索请求是指用于获取创意文本的创意关键词的请求。所述创意关键词是从创意文本中提取得到的,所述创意文本是指与创意有关的文章或句子等,所述创意文本可以以列表形式存储,如表5至表12所示。所述搜索范围可以理解为允许用户搜索的范围,可以以部门或公司等为单位设置搜索范围,并且可以为不同岗位属性的用户设置不同的搜索范围。所述创意关键词的搜索次数可以理解为在预设时间范围内所述创意关键词被搜索的次数。所述创意关键词的权重因子与时间有关,可以将权重因子设置为在预设时间范围内随着时间增加而衰减。
其中,确定创意关键词的搜索权重的过程大致为:当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0。然后按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子。最终将所述创意关键词的权重值与权重因子乘积,确定为所述创意关键词的搜索权重。
需要说明的是,步骤S308的实施原理与步骤S101处的描述相同,相同之处不再赘述。
步骤S309:根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系。
需要说明的是,步骤S309的实施原理与步骤S206中有关搜索范围处相同,相同之处不再赘述。
步骤S310:从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
需要说明的是,步骤S306的实施原理与步骤S207中有关搜索范围处相同,相同之处不再赘述。
步骤S311:接收用户触发的生成相似度报告的请求,所述请求指示了创意编号以及对比库范围。
可以理解的是,管理岗审核创意时,点击“生成相似度报告”按钮,发起异步线程后台跑批,即将该任务信息插入异步任务管理表,任务完成状态调整为0。获取该创意的创意编号,根据表2中的创意编号筛选该创意明细,获取创意关键词。
需要说明的是,对比库范围可以理解为相似度创意匹配范围,例如:以牵头创意管理岗、一级分行牵头创意管理以及二级分行创意管理岗为例,不同岗位对应的对比库范围的定义如下:
1)二级分行创意管理岗:该活动二级行下所有的创意;
2)一级分行牵头创意管理岗:该活动一级行范围内所有的创意;
3)总行牵头创意管理岗:该活动下总行提出的创意和分行上报总行的创意。
步骤S312:获取所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词。
步骤S313:根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本。
在步骤S313中,首先将所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词合并成一个预料集合。然后计算所述创意编号的创意文本在所述预料集合中的词频。再根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度。最终确定与所述创意编号的创意文本的相似度在预设范围的其他创意文本。
其中,可以根据所述创意编号的创意文本在所述预料集合中的词频,生成所述创意编号的创意文本的词频向量。然后根据所述创意编号的创意文本的词频向量,计算其他创意文本与所述创意编号的创意文本的相似度,所述相似度为余弦相似度,余弦相似度的值越大就表示越相似。
步骤S314:根据与所述创意编号的创意文本的相似度在预设范围内的其他创意文本,生成相似度报告,参见表13所示。
在步骤S314之后,将生成的相似度报告存储至数据库中,将异步任务管理表的任务完成状态调整为1。后台起轮询扫描任务,扫描异步任务管理表中任务完成状态为1且任务通知标志为0的任务,若扫描到该任务,则发送消息通知给异步任务创建的管理岗,并将任务通知标志置为1。
需要说明的是,通过步骤S311至S314可以对该机构下相似度最高的预设数量(例如:5条)创意生成相似度报告,并展示在创意详情中,创意管理岗根据相似度报告对相似创意进行整合、转化等操作。
表13相似度报告
在本发明实施例中,从创意文本中提取创意关键词,在接收到用户触发的搜索请求,根据该搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,所述关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以提高搜索质量,可以解决现有搜索方式搜索质量不高的问题。另外,通过该实施方式还可以相似度最高的预设数量创意生成相似度报告,并展示在创意详情中,创意管理岗根据相似度报告对相似创意进行整合、转化等操作。
可以理解的是,创意管理岗或综合管理岗人员审核当前创意时,可异步计算当前创意的相似度,并获取相似度报告。可以查询创意、创意方案、创意需求方案的相似明细信息。创意管理岗、综合管理岗人员通过创意的相似度计算获取相似度报告,可一键审批相似的创意,简化创意审批流程。
综上所述,本发明实施例按照“实用性、先进性、前瞻性”的原则,通过自然语言处理技术,将创意库的创意提炼主题、全局范围模糊搜索与创意相似比对,优化全行统一的创意全流程管理平台,提升创意统筹的质量和效率。具体包括三个方面:
1)采用创意关键词提取,实现了创意库中存量的创意的关键词提取与增量创意的关键词提取,该实施方式可以解决创意主题分散、聚焦不足的问题;
2)采用创意关键词搜索,实现了创意库的创意关键词智能模糊查询功能,通过总行与分行的不同部门的权限配置,实现创意库的总行与分行不同活动的创意关键词的查询权限可配置化,分行活动的创意关键词查询相互隔离,也可授予其他分行查询权限。该实施方式可以解决数量过多、质量不高的问题;
3)采用创意文本相似度计算,可异步计算当前创意的相似度,并获取相似度报告。可以查询创意、创意方案、创意需求方案的相似明细信息,该实施方式可以为创意筛选整合审核提供依据。
图4是本发明实施例的创意关键词的处理装置的模块示意图,参见图4,该创意关键词的处理装置400包括:
第一确定模块401,用于接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;
第二确定模块402,用于根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;
展示模块403,用于从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
可选地,第一确定模块401进一步用于:
当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0;
按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子;
将所述创意关键词的权重值与权重因子的乘积,确定为所述创意关键词的搜索权重。
可选地,所述展示模块403进一步用于:
从所述关系队列中随机选取预设数量的创意关键词,作为要展示的创意关键词;
或者,从所述关系队列的队首选取预设数量的创意关键词,作为要展示的创意关键词,所述关系队列中的所述创意关键词的搜索权重从大到小排列。
可选地,所述创意关键词的处理装置还包括:
第三确定模块,用于接收用户触发的搜索请求,确定所述用户的岗位属性和所属的机构编号;
第四确定模块,用于根据所述用户的岗位属性和所属的机构编号以及预设的岗位属性、机构编号与搜索范围的对应关系,确定所述用户的搜索范围;
第一执行模块,用于若所述搜索请求符合所述用户的搜索范围,则执行根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤;
第二执行模块,用于否则,拒绝所述用户的搜索请求。
可选地,所述创意关键词的处理装置还包括:
配置模块,用于根据用户触发的配置操作,在所述创意关键词的关系队列中增加和/或删除创意关键词。
可选地,所述创意关键词的处理装置还包括:
获取模块,用于获取创意预料库中待提取的创意文本;
第五确定模块,用于确定所述创意文本中指定词性的单词的词频TF值;
第六确定模块,用于确定所述指定词性的单词对应的逆向文件频率IDF值;
计算模块,用于计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词。
可选地,所述计算模块进一步用于:
将所述创意文本中指定词性的单词按照TF-IDF值由大到小排序,从队首选取第一预设数量的指定词性的单词作为所述创意文本的创意关键词。
可选地,所述创意关键词的处理装置还包括:
分割模块,用于确定所述创意文本中指定词性的单词的词频TF值之前,将所述创意文本按照句子进行分割;
标注模块,用于将每个句子进行分词和词性标注处理;
筛选模块,用于根据所述每个句子的分词结果以及词性标注结果,从每个句子中筛选出指定词性的单词。
可选地,所述创意关键词的处理装置还包括:
接收模块,用于接收用户触发的生成相似度报告的请求,所述请求指示了创意编号以及对比库范围;
第二获取模块,用于获取所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词;
第七确定模块,用于根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本;
生成模块,用于根据与所述创意编号的创意文本的相似度在预设范围内的其他创意文本,生成相似度报告。
可选地,所述第七确定模块进一步用于:
将所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词合并成一个预料集合;
计算所述创意编号的创意文本在所述预料集合中的词频;
根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度;
确定与所述创意编号的创意文本的相似度在预设范围的其他创意文本。
可选地,所述第七确定模块进一步用于:
根据所述创意编号的创意文本在所述预料集合中的词频,生成所述创意编号的创意文本的词频向量;
根据所述创意编号的创意文本的词频向量,计算其他创意文本与所述创意编号的创意文本的相似度。
可选地,所述相似度为余弦相似度。
在本发明实施例中,根据用户触发的搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,所述关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以提高搜索质量,可以解决现有搜索方式搜索质量不高的问题。
图5示出了可以应用本发明实施例的创意关键词的处理方法或创意关键词的处理装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的创意关键词的处理方法一般由服务器505执行,相应地,创意关键词的处理装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的终端设备的计算机系统600的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
在本发明实施例中,根据用户触发的搜索请求从创意关键词的关系队列中选取要展示的创意关键词,并将要展示的创意关键词进行展示,所述关系队列用于表示搜索范围内创意关键词按照搜索权重确定的排序关系,该搜索权重与创意关键词的搜索次数以及权重因子有关。该实施方式可以实现全局模糊搜索,可以解决现有搜索方式搜索质量不高的问题。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (15)
1.一种创意关键词的处理方法,其特征在于,包括:
接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;
根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;
从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
2.根据权利要求1所述的方法,其特征在于,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重包括:
当所述搜索范围内创意关键词的搜索次数每增加一次时,将所述创意关键词的权重值加N,N>0;
按照权重因子随时间衰减的规则,确定接收到用户触发的搜索请求时所述创意关键词的权重因子;
将所述创意关键词的权重值与权重因子的乘积,确定为所述创意关键词的搜索权重。
3.根据权利要求1所述的方法,其特征在于,从所述关系队列中选取要展示的创意关键词包括:
从所述关系队列中随机选取预设数量的创意关键词,作为要展示的创意关键词;
或者,从所述关系队列的队首选取预设数量的创意关键词,作为要展示的创意关键词,所述关系队列中的所述创意关键词的搜索权重从大到小排列。
4.根据权利要求1所述的方法,其特征在于,在接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤之前,所述方法还包括:
接收用户触发的搜索请求,确定所述用户的岗位属性和所属的机构编号;
根据所述用户的岗位属性和所属的机构编号以及预设的岗位属性、机构编号与搜索范围的对应关系,确定所述用户的搜索范围;
若所述搜索请求符合所述用户的搜索范围,则执行根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤;
否则,拒绝所述用户的搜索请求。
5.根据权利要求1所述的方法,其特征在于,根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列的步骤之后,所述方法还包括:
根据用户触发的配置操作,在所述创意关键词的关系队列中增加和/或删除创意关键词。
6.根据权利要求1所述的方法,其特征在于,在接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重的步骤之前,所述方法包括:
获取创意预料库中待提取的创意文本;
确定所述创意文本中指定词性的单词的词频TF值;
确定所述指定词性的单词对应的逆向文件频率IDF值;
计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词。
7.根据权利要求6所述的方法,其特征在于,根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词包括:
将所述创意文本中指定词性的单词按照TF-IDF值由大到小排序,从队首选取第一预设数量的指定词性的单词作为所述创意文本的创意关键词。
8.根据权利要求6所述的方法,其特征在于,确定所述创意文本中指定词性的单词的词频TF值之前,所述方法还包括:
将所述创意文本按照句子进行分割;
将每个句子进行分词和词性标注处理;
根据所述每个句子的分词结果以及词性标注结果,从每个句子中筛选出指定词性的单词。
9.根据权利要求6所述的方法,其特征在于,在计算所述指定词性的单词的TF-IDF值,并根据所述指定词性的单词的TF-IDF值,从所述创意文本中提取创意关键词的步骤之后,所述方法还包括:
接收用户触发的生成相似度报告的请求,所述请求指示了创意编号以及对比库范围;
获取所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词;
根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本;
根据与所述创意编号的创意文本的相似度在预设范围内的其他创意文本,生成相似度报告。
10.根据权利要求9所述的方法,其特征在于,根据所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词,确定与所述创意编号的创意文本的相似度在预设范围内的其他创意文本包括:
将所述创意编号的创意文本对应的创意关键词以及所述对比库范围内的关键词合并成一个预料集合;
计算所述创意编号的创意文本在所述预料集合中的词频;
根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度;
确定与所述创意编号的创意文本的相似度在预设范围的其他创意文本。
11.根据权利要求10所述的方法,其特征在于,根据所述创意编号的创意文本在所述预料集合中的词频,计算其他创意文本与所述创意编号的创意文本的相似度包括:
根据所述创意编号的创意文本在所述预料集合中的词频,生成所述创意编号的创意文本的词频向量;
根据所述创意编号的创意文本的词频向量,计算其他创意文本与所述创意编号的创意文本的相似度。
12.根据权利要求9或10所述的方法,其特征在于,所述相似度为余弦相似度。
13.一种创意关键词的处理装置,其特征在于,包括:
第一确定模块,用于接收用户触发的搜索请求且所述搜索请求符合搜索范围时,根据所述搜索范围内创意关键词的搜索次数和权重因子,确定所述创意关键词的搜索权重;
第二确定模块,用于根据所述创意关键词的搜索权重,确定所述创意关键词的关系队列,所述关系队列用于表示所述搜索范围内所述创意关键词按照所述搜索权重确定的排序关系;
展示模块,用于从所述关系队列中选取要展示的创意关键词,并将要展示的所述创意关键词进行展示。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-12中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010983469.7A CN112100216A (zh) | 2020-09-17 | 2020-09-17 | 创意关键词的处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010983469.7A CN112100216A (zh) | 2020-09-17 | 2020-09-17 | 创意关键词的处理方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112100216A true CN112100216A (zh) | 2020-12-18 |
Family
ID=73758940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010983469.7A Pending CN112100216A (zh) | 2020-09-17 | 2020-09-17 | 创意关键词的处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112100216A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536118A (zh) * | 2021-06-29 | 2021-10-22 | 未鲲(上海)科技服务有限公司 | 搜索默认词的配置方法、装置、计算机设备及存储介质 |
CN115080718A (zh) * | 2022-06-21 | 2022-09-20 | 浙江极氪智能科技有限公司 | 一种文本关键短语的抽取方法、系统、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547757A (zh) * | 2015-09-17 | 2017-03-29 | 北京国双科技有限公司 | 匹配关键词与创意内容的方法和装置 |
CN107577726A (zh) * | 2017-08-22 | 2018-01-12 | 努比亚技术有限公司 | 一种搜索方法、服务器及计算机可读存储介质 |
CN107992542A (zh) * | 2017-11-27 | 2018-05-04 | 中山大学 | 一种基于主题模型的相似文章推荐方法 |
CN111046141A (zh) * | 2019-12-03 | 2020-04-21 | 新华智云科技有限公司 | 一种基于历史时间特征的文本库关键词精炼方法 |
-
2020
- 2020-09-17 CN CN202010983469.7A patent/CN112100216A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547757A (zh) * | 2015-09-17 | 2017-03-29 | 北京国双科技有限公司 | 匹配关键词与创意内容的方法和装置 |
CN107577726A (zh) * | 2017-08-22 | 2018-01-12 | 努比亚技术有限公司 | 一种搜索方法、服务器及计算机可读存储介质 |
CN107992542A (zh) * | 2017-11-27 | 2018-05-04 | 中山大学 | 一种基于主题模型的相似文章推荐方法 |
CN111046141A (zh) * | 2019-12-03 | 2020-04-21 | 新华智云科技有限公司 | 一种基于历史时间特征的文本库关键词精炼方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536118A (zh) * | 2021-06-29 | 2021-10-22 | 未鲲(上海)科技服务有限公司 | 搜索默认词的配置方法、装置、计算机设备及存储介质 |
CN113536118B (zh) * | 2021-06-29 | 2023-04-07 | 未鲲(上海)科技服务有限公司 | 搜索默认词的配置方法、装置、计算机设备及存储介质 |
CN115080718A (zh) * | 2022-06-21 | 2022-09-20 | 浙江极氪智能科技有限公司 | 一种文本关键短语的抽取方法、系统、设备及存储介质 |
CN115080718B (zh) * | 2022-06-21 | 2024-04-09 | 浙江极氪智能科技有限公司 | 一种文本关键短语的抽取方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11663254B2 (en) | System and engine for seeded clustering of news events | |
CN107729336B (zh) | 数据处理方法、设备及系统 | |
US10146878B2 (en) | Method and system for creating filters for social data topic creation | |
WO2010144618A1 (en) | Methods, apparatus and software for analyzing the content of micro-blog messages | |
US11263523B1 (en) | System and method for organizational health analysis | |
WO2018128658A1 (en) | Search engine | |
Geiß et al. | Neckar: A named entity classifier for wikidata | |
CN116737915B (zh) | 基于知识图谱的语义检索方法、装置、设备及存储介质 | |
US20190213208A1 (en) | Interactive patent visualization systems and methods | |
CA2956627A1 (en) | System and engine for seeded clustering of news events | |
CN112100396A (zh) | 一种数据处理方法和装置 | |
CN110737824B (zh) | 内容查询方法和装置 | |
CN112100216A (zh) | 创意关键词的处理方法和装置 | |
Yeshpanov et al. | KazNERD: Kazakh named entity recognition dataset | |
CN111191153A (zh) | 一种信息技术咨询服务展示装置 | |
CN112182239A (zh) | 信息检索方法和装置 | |
US20140201193A1 (en) | Intellectual property asset information retrieval system | |
CN111126073A (zh) | 语义检索方法和装置 | |
CN111368036B (zh) | 用于搜索信息的方法和装置 | |
CN113095078A (zh) | 关联资产确定方法、装置和电子设备 | |
JP2010218216A (ja) | 類似文書検索システム、方法及びプログラム | |
CN113177116B (zh) | 信息展示方法及装置、电子设备、存储介质及程序产品 | |
KR20190100533A (ko) | 인공지능을 활용한 데이터베이스 모듈 및 이를 이용하는 경제데이터 제공 시스템 및 방법 | |
CN111143694B (zh) | 一种情报推送方法、装置及存储设备、程序 | |
US20240168998A1 (en) | Information processing apparatus, information processing system, information processing method, and non-transitory recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |