CN113486184A - 关键词确定方法、装置、设备及存储介质 - Google Patents
关键词确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113486184A CN113486184A CN202111042705.6A CN202111042705A CN113486184A CN 113486184 A CN113486184 A CN 113486184A CN 202111042705 A CN202111042705 A CN 202111042705A CN 113486184 A CN113486184 A CN 113486184A
- Authority
- CN
- China
- Prior art keywords
- information description
- target
- text
- determining
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开关于一种关键词确定方法、装置、设备及存储介质,该方法通过获取信息描述文本以及对应的内容类别标签;从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;基于确定的每个信息描述子文本属于该内容类别标签的类别参数,确定满足预设条件的目标字符;根据该目标字符,确定信息描述文本的关键词。如此无需依赖于分词的准确率,同时无需额外进行人工数据标注,简化了关键词确定流程,也提高了关键词提取的准确性和效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种关键词确定方法、装置、设备及存储介质。
背景技术
随着短视频的快速发展,短视频与电商商品的结合越来越成为一种新的发展趋势。在智能定向、用户兴趣标签挖掘等任务中,商品类别和关键词都起着十分重要的作用。然而关键词作为比商品类别更细粒度的描述,其挖掘难度更大。
相关技术中,对于关键词提取主要采用统计类方法,该方法通过先对文本进行分词,然后根据分词的统计类特征和相关性来提取关键词,然而该方法非常依赖分词的准确率,存在着整体关键词提取准确性不高等问题。
发明内容
本公开提供一种关键词确定方法、装置、设备及存储介质,以至少解决相关技术中关键词提取准确性不高等问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种关键词确定方法,包括:
获取信息描述文本以及所述信息描述文本对应的内容类别标签;
从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;
确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符;
根据所述目标字符,确定所述信息描述文本的关键词。
作为一种可选的实施方式,所述确定每个所述信息描述子文本属于所述内容类别标签的类别参数包括:
调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息;
基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。
作为一种可选的实施方式,所述基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符包括:
获取所述信息描述文本属于所述内容类别标签的目标类别参数;
基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符;
根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
作为一种可选的实施方式,所述基于排序结果确定满足预设条件的目标字符包括:
基于排序结果确定满足预设条件的目标候选字符;
对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
作为一种可选的实施方式,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符步骤之前,所述方法还包括:
从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同;
获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度;
相应的,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符包括:
基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度;
根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
作为一种可选的实施方式,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
对所述目标字符进行融合处理,获得至少一个融合字符;
将所述至少一个融合字符确定为所述信息描述文本的关键词。
作为一种可选的实施方式,所述方法还包括:
对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
基于每个所述信息描述组合文本对应的类别置参数,确定满足预设条件的信息描述组合文本对应的目标替换字符;
相应的,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
根据本公开实施例的第二方面,提供一种关键词确定装置,包括:
第一获取模块,被配置为执行获取信息描述文本以及所述信息描述文本对应的内容类别标签;
第一处理模块,被配置为执行从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;
第一确定模块,被配置为执行确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
第二确定模块,被配置为执行基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符;
关键词确定模块,被配置为执行根据所述目标字符,确定所述信息描述文本的关键词。
作为一种可选的实施方式,所述第一确定模块包括:
第一确定子模块,被配置为执行调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息;
第二确定子模块,被配置为执行基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。
作为一种可选的实施方式,所述第二确定模块包括:
获取子模块,被配置为执行获取所述信息描述文本属于所述内容类别标签的目标类别参数;
第三确定子模块,被配置为执行基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符;
第四确定子模块,被配置为执行根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
作为一种可选的实施方式,所述第四确定子模块包括:
候选确定单元,被配置为执行基于排序结果确定满足预设条件的目标候选字符;
目标确定单元,被配置为执行对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
作为一种可选的实施方式,所述装置还包括:
第二获取模块,被配置为执行从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同;
第三确定模块,被配置为执行获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度;
相应的,所述目标确定单元包括:
扩展确定子单元,被配置为执行基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度;
目标确定子单元,被配置为执行根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
作为一种可选的实施方式,所述关键词确定模块包括:
融合处理子模块,被配置为执行对所述目标字符进行融合处理,获得至少一个融合字符;
关键词确定子模块,被配置为执行将所述至少一个融合字符确定为所述信息描述文本的关键词。
作为一种可选的实施方式,所述装置还包括:
第二处理模块,被配置为执行对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
第四确定模块,被配置为执行确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
第五确定模块,被配置为执行基于每个所述信息描述组合文本对应的类别参数,确定满足预设条件的信息描述组合文本对应的目标替换字符;
相应的,所述关键词确定模块,被配置为执行根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
根据本公开实施例的第三方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述中任一实施方式所述的关键词确定方法。
根据本公开实施例的第四方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如上述任一实施方式所述的关键词确定方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述任一种实施方式中提供的关键词确定方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例通过获取信息描述文本以及对应的内容类别标签;从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;基于确定的每个信息描述子文本属于该内容类别标签的类别参数,确定满足预设条件的目标字符;根据该目标字符,确定信息描述文本的关键词。如此利用已有的信息描述文本的内容类别标签、以及每个信息描述子文本属于该内容类别标签的类别参数来进行关键词提取,无需依赖于分词的准确率,同时无需额外进行人工数据标注,利用字符抽取处理以及类别参数学习到的语义信息来进行关键词提取,简化了关键词确定流程,也提高了关键词提取的准确性和效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本公开的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种应用关键词确定方法的系统的架构图。
图2是根据一示例性实施例示出的一种关键词确定方法的流程图。
图3是根据一示例性实施例示出的一种确定目标字符步骤的流程图。
图4是根据一示例性实施例示出的另一种确定目标字符步骤的部分流程图。
图5是根据一示例性实施例示出的另一种关键词确定方法的部分流程图。
图6是根据一示例性实施例示出的又一种关键词确定方法的部分流程图。
图7是根据一示例性实施例示出的一种关键词确定装置框图。
图8是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
图1是根据一示例性实施例示出的一种应用关键词确定方法的系统的架构图,参见图1,该架构图可以包括终端10和服务器20。
其中,终端10可以是但不限于为智能手机、平板电脑、笔记本电脑、台式计算机、智能可穿戴设备、数字助理、增强现实设备、虚拟现实设备等实体设备或者运行于实体设备中的应用程序、小程序中一种或多种。
服务器20可以是终端10上应用程序对应的服务器,仅作为示例,服务器20可以是但不限于为独立的服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器等中一种或多种。
仅作为示例,终端10上安装的应用程序可以由服务器20提供服务,用户通过终端10上安装的应用程序实现例如数据传输、交互等功能。该终端10与服务器20之间可以通过有线或无线通信方式进行直接或间接地连接,从而实现关键词确定流程,本公开实施例在此不作限制。
本公开实施例提供的关键词确定方法,可以由关键词确定装置来执行,该关键词确定装置可以是硬件形式或软件形式集成在客户端或服务器等电子设备中,也可以由终端或服务器单独执行实现,或者可以由终端和服务器协同执行实现。
仅作为示例,本公开实施例提供的关键词确定方法可以应用于智能定向、用户兴趣标签挖掘、商品推荐等任务场景,当然还可适用于其他需要关键词确定的场景。
图2是根据一示例性实施例示出的一种关键词确定方法的流程图,如图2所示,关键词确定方法可以应用于电子设备,以该电子设备为上述实施环境示意图中服务器为例进行说明,包括以下步骤。
在步骤S201中,获取信息描述文本以及所述信息描述文本对应的内容类别标签。
其中,信息描述文本是指需要进行关键词确定且包含多个字符串的组合。仅作为示例,该信息描述文本可以包括但不限于为信息标题、信息介绍、信息摘要等等,这里的信息可以包括但不限于为商品、文章、新闻、视频等等。应理解,这里的信息描述文本不限于中文文本、英文文本、及其他语言文本,也可为多语言组合的混合文本或者其他形式的文本。
内容类别标签是指信息描述文本中内容所属的类别。仅作为示例,以信息描述文本为商品标题为例,若信息描述文本为“XXX定妆蜜粉赠散粉刷”,其对应的内容类别标签为“美妆护肤-彩妆-蜜粉/散粉/粉饼”。若信息描述文本为“定妆喷雾水”,则其对应的内容类别标签为“面部护肤-爽肤水/化妆水”。若信息描述文本为“XX口红”,则其对应的内容类别标签为“彩妆-口红”。若信息描述文本为“XXX洁面乳”,则其对应的内容类别标签为“美妆护肤-面部护肤-洁面用品”。
需要说明的是,内容类别标签可以通过查找例如商品库等对应的类别标签表进行确定,也可通过类别分类器进行确定,本公开对此不作具体限定。
在步骤S202中,从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本。
可选地,在获取到信息描述文本之后,可以从信息描述文本中抽取至少一个字符,得多个信息描述子文本,也即对信息描述文本中至少一个屏蔽字符进行屏蔽处理,以获得多个信息描述子文本。每个信息描述子文本仅包含信息描述文本中部分文本信息,这里的至少一个字符可以包括一个字符串、连续的多个字符,也可包括间隔的多个字符,这里的多个字符可以为2个或多个。
仅作为示例,以信息描述文本为商品标题为例,若信息描述文本为“涂抹式水光玻XY精华”,对其进行至少一个字符的抽取处理,获得多个信息描述子文本,如以下表1所示:
表1
在从所述信息描述文本中抽取至少一个字符的情况下,可以在被抽取的字符所在位置设置相应的占位符,以便于后续基于该占位符快速识别被抽取的字符。
当然,在从信息描述文本进行字符抽取处理之前,还可以对信息描述文本进行预处理。这里的预处理可以但不限于为去除助词处理、语言转换处理、同义词替换、错别字纠正等等。
在步骤S203中,确定每个所述信息描述子文本属于所述内容类别标签的类别参数。
其中,类别参数用于表征信息描述子文本属于所述内容类别标签的可信程度。仅作为示例,该类别参数包括但不限于为类别置信度、类别准确度、类别可信度等。以类别置信度为例,若类别置信度越大,则对应的信息描述子文本属于该内容类别标签的可信度越高;相反,若类别置信度越低,则对应的信息描述子文本属于该内容类别标签的可信度越低。
在一可选实施例中,所述确定每个所述信息描述子文本属于所述内容类别标签的类别参数包括:
在步骤S2031中,调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息。
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。该类别分类模型可以是基于字的双向语言分类模型,例如BiLSTM模型(Bi-directional Long Short-Term Memory,是由前向LSTM与后向LSTM组合而成)等。
该类别分类模型可以是已经训练好的模型。在训练过程中,可以利用已有的信息库训练该类别分类模型。由于信息库中涵盖了大量现有的信息描述样本文本和对应的样本内容标签,无需进行额外的人工标注,通过有监督训练类别分类模型,提高训练好的类别分类模型的分类准确率,进而有利于提高后续的关键词确定的准确性。
可选地,在获取到多个信息描述子文本之后,可以调用训练好的类别分类模型对每个信息描述子文本进行分类处理,得到每个信息描述子文本属于各内容类别的预测类别信息。该预测类别信息可以表征信息描述子文本属于所述内容类别标签的可能性。该预测类别信息可以包括但不限于为概率值、准确率值等。仅作为示例,以预测类别信息包括概率值为例,若总内容类别为5个,对应的内容类别标签分别记为A~E,该信息描述文本对应的内容类别标签为C,通过类别分类模型识别到某个信息描述子文本z1属于各内容类别{A,B,C,D,E}的概率值序列对应为{0.2,0.1,0.5,0.1,0.1},则该信息描述子文本z1属于内容类别标签C的概率值为0.5。
在步骤S2032中,基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数。
可选地,在确定了每个信息描述子文本属于各内容类别的预测类别信息,可以根据每个信息描述子文本属于内容类别标签的预测类别信息,计算信息描述子文本属于该内容类别标签的类别参数。
仅作为示例,以信息描述文本为商品标题为例,若信息描述文本为“涂抹式水光玻XY精华”,其对应的内容类别标签为“美妆护肤-面部护肤-面部精华”,各信息描述子文本属于该内容类别标签的类别置信度如下表2所示:
表2
其中,A1~A6的数值大小排序为:A2>A3>A4>A1>A5>A6。
上述实施例,通过调用类别分类模型对每个信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息,并基于所确定的预测类别信息,确定每个所述信息描述子文本属于内容类别标签的类别参数,如此可减少计算量,提高关键词确定效率,适用于在线关键词确定场景的应用。
在步骤S204中,基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符。
可选地,在确定了每个信息描述子文本对应的类别参数之后,可以根据该类别参数的大小,可以确定类别参数满足预设条件的信息描述子文本为目标信息描述子文本,并将目标信息描述子文本中除抽取的字符之外的剩余字符作为目标字符。这里的预设条件可以包括类别参数低于预设阈值,也可以为按照类别参数由小到大顺序排列中TOP N个类别参数,N为正整数。
仅作为示例,以上述例子而言,如表2所示,在各信息描述子文本中,“涂抹式水光玻XY”和“涂抹式水光玻精华”对应的类别参数(如A5和A6)明显低于其他信息描述子文本的类别参数(如A1~A4),则可以选择这两个信息描述子文本中除抽取的字符之外的剩余字符,也即“精华”和“XY”,并将“精华”和“XY”作为确定的目标字符。
在一可选实施例中,如图3所示,所述基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符包括:
在步骤S301中,获取所述信息描述文本属于所述内容类别标签的目标类别参数。
可选地,调用所述的类别分类模型对信息描述文本进行分类处理,获得所述信息描述文本属于所述内容类别标签的概率值,基于该概率值确定所述信息描述文本属于所述内容类别标签的目标类别参数。仅作为示例,该目标类别参数W0的取值可以为0.9~1中任意值。
在步骤S302中,基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符。
其中,所述第一重要度表征候选字符对内容类别标签的奉献程度。
可选地,在获取到每个所述信息描述子文本对应的类别参数Wi以及所述目标类别参数W0之后,可以对类别参数Wi与目标类别参数W0进行数学运算,得到每个所述信息描述子文本对应的候选字符的第一重要度Qi。该数学运算需满足计算得到的第一重要度与对应的类别参数成反比,本公开对该数学运算不作具体限定。
仅作为示例,以信息描述文本为商品标题为例,若信息描述文本为“涂抹式水光玻XY精华”,其目标类别参数W0为A0,则每个信息描述子文本对应的候选字符第一重要度Qi可以为目标类别参数W0与对应的类别参数Wi之间的差值,具体如下表3所示:
表3
其中,B1~B6的数值大小排序为:B2<B3<B4<B1<B5<B6。
在步骤S303中,根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
可选地,服务器可以按照每个信息描述子文本对应的候选字符第一重要度Qi的高低顺序进行排序,将排序结果中满足预设条件的候选字符作为目标字符。这里的预设条件包括但不限于为:第一重要度大于等于预设重要度阈值对应的候选字符,和/或排序靠前的预设数量的第一重要度对应的候选字符。
上述实施例,通过信息描述子文本对应的候选字符的重要度维度来确定目标字符,能够基于候选字符所确定的目标字符更符合信息描述文本的本质信息,进而有利于提高后续基于目标字符来确定信息描述文本的关键词的准确率。
在一可选实施例中,如图4所示,所述基于排序结果确定满足预设条件的目标候选字符包括:
在步骤S401中,基于排序结果确定满足预设条件的目标候选字符。
可选地,服务器可以按照每个信息描述子文本对应的候选字符第一重要度Qi的高低顺序进行排序,将排序结果中满足预设条件的候选字符作为目标候选字符,而不作为目标字符。该目标候选字符的数量为一个或多个。这里的预设条件包括但不限于为:第一重要度大于等于预设重要度阈值对应的目标候选字符,和/或排序靠前的预设数量的第一重要度对应的目标候选字符。
在步骤S402中,对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
可选地,在确定了该信息描述文本对应的目标候选字符之后,可以将目标候选字符分别在该信息描述文本和全部目标信息描述文本进行基于置信度或重要度的聚合处理;再根据聚合处理结果,确定满足预设条件的目标字符。这里的预设条件包括但不限于为:聚合处理后的重要度大于等于预设重要度阈值对应的目标候选字符,排序靠前的预设数量的聚合后的重要度对应的目标候选字符;聚合处理后的置信度大于等于预设置信度阈值对应的目标候选字符,排序靠前的预设数量的聚合后的置信度对应的目标候选字符。
上述实施例,由于目标信息描述文本与信息描述文本属于同一个内容类别标签,通过对满足预设条件的目标候选字符,在所述信息描述文本和全部目标信息描述文本中进行聚合处理,如此经聚合处理后的目标候选字符更能反映其在所属内容类别标签的整体置信度或重要度,避免基于目标候选字符在该单一的信息描述文本中的置信度或重要度所带来的误差,且使得根据聚合处理结果所确定的目标字符更能反映该信息描述文本的潜在内容,进一步提高了关键词的确定准确率。
在一可选实施例中,如图5所示,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符步骤之前,所述方法还包括:
在步骤S501中,从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同。
可选地,信息库中存储不同内容类别标签对应的信息描述文本。以信息描述文本为商品标题为例,若信息描述文本(也即商品标题A)为“涂抹式水光玻XY精华”,其对应的内容类别标签为“美妆护肤-面部护肤-面部精华”,可以从信息库中查找属于该“美妆护肤-面部护肤-面部精华”的内容类别标签的其他信息描述文本(也即其他商品标题),作为全部目标信息描述文本。
在步骤S502中,获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度。
可选地,按照确定该信息描述文本对应的第一重要度的方法,确定目标信息描述文本对应的多个目标信息描述子文本,以及每个所述目标信息描述子文本对应的候选字符的第二重要度。该第二重要度表征候选字符对内容类别标签的奉献程度。
相应的,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符包括:
在步骤S503中,基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度。
可选地,在获取每个目标候选字符在所述信息描述文本对应的第一重要度Qi,以及每个目标候选字符在全部所述目标信息描述文本对应的第二重要度Pi之后,可以对第一重要度Qi和第二重要度Pi进行加权均值处理,以实现每个目标候选字符进行基于重要度的聚合处理,得到每个目标候选字符对应的扩展重要度Ki。扩展重要度表征每个目标候选字符对同类别的全部信息描述子文本中的内容类别标签的平均奉献程度。
在步骤S504中,根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
可选地,这里的预设条件包括但不限于为:扩展重要度大于等于预设重要度阈值对应的目标候选字符,和/或排序靠前的预设数量的扩展重要度对应的目标候选字符。
上述实施例,通过基于目标候选字符在信息描述文本对应的第一重要度,以及目标候选字符在全部目标信息描述文本对应的第二重要度,对目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度,由于该扩展重要度表征每个目标候选字符对同类别的全部信息描述子文本中的内容类别标签的平均奉献程度,使得根据扩展重要度所确定的目标字符更能反映该信息描述文本的潜在内容,进一步提高了关键词的确定准确率。
在步骤S205中,根据所述目标字符,确定所述信息描述文本的关键词。
在一可选实施例中,将所确定的目标字符作为所述信息描述文本的关键词。
在另一可选实施例中,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
在步骤S2051中,对所述目标字符进行融合处理,获得至少一个融合字符;
在步骤S2052中,将所述至少一个融合字符确定为所述信息描述文本的关键词。
可选地,这里的融合处理是指将对目标字符进行基于语义的字符组合处理。仅作为示例,以信息描述文本为商品标题为例,若信息描述文本为“涂抹式水光玻XY精华”,其确定的目标字符为“精华”、“XY”和“玻”,则经过对这些目标字符进行融合处理,得到“精华”和“玻XY”的两个融合字符,也可得到“玻XY精华”的一个融合字符;接着,将确定的融合字符确定为该信息描述文本的关键词。
上述实施例,根据对目标字符进行融合处理所得的至少一个融合字符确定信息描述文本的关键词,所确定的关键词的形式更丰富灵活,且关键词的内容更准确以及更贴合实际需求。
本公开实施例通过获取信息描述文本以及对应的内容类别标签;从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;基于确定的每个信息描述子文本属于该内容类别标签的类别参数,确定满足预设条件的目标字符;根据该目标字符,确定信息描述文本的关键词。如此利用已有的信息描述文本的内容类别标签、以及每个信息描述子文本属于该内容类别标签的类别参数来进行关键词提取,无需依赖于分词的准确率,同时无需额外进行人工数据标注,利用字符抽取处理以及类别参数学习到的语义信息来进行关键词提取,简化了关键词确定流程,也提高了关键词提取的准确性和效率。
在一可选实施例中,所述方法还可以包括:
在步骤S601中,对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
在步骤S602中,确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
在步骤S603中,基于每个所述信息描述组合文本对应的类别参数,确定满足预设条件的信息描述组合文本对应的目标替换字符。
可选地,对信息描述文本中至少一个字符进行位置替换处理,也即对信息描述文本中各字符进行重新组合,得到多个信息描述组合文本。接着,可以调用类别分类模型对每个信息描述组合文本进行分类处理,确定每个信息描述组合文本属于该内容类别标签的类别参数,也即确定每个信息描述组合文本属于该内容类别标签的可信程度。接着,基于每个所述信息描述组合文本对应的类别参数,确定满足预设条件的信息描述组合文本对应的目标替换字符。这里的预设条件可包括但不限于为:类别置信度大于等于预设置信度阈值对应的替换字符,和/或排序靠前的预设数量的类别置信度对应的替换字符。
相应的,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
在步骤S604中,根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
可选地,可以对信息描述子文本对应的目标字符和信息描述组合文本对应的目标替换字符进行字符去重处理,将去重处理后的字符确定为信息描述文本的关键词。
上述实施例,通过对信息描述文本中至少一个字符进行位置替换处理,并基于经位置替换处理所得的每个信息描述组合文本属于所述内容类别标签的类别参数,确定目标替换字符,以及根据信息描述子文本对应的目标字符以及信息描述组合文本对应的目标替换字符,确定信息描述文本的关键词,如此通过结合位置替换处理、以及字符抽取处理和类别参数学习到的语义信息来进行关键词提取,进一步提高了关键词提取的准确性和效率。
图7是根据一示例性实施例示出的一种关键词确定装置框图。参照图7,该装置应用于电子设备,包括:
第一获取模块710,被配置为执行获取信息描述文本以及所述信息描述文本对应的内容类别标签;
第一处理模块720,被配置为执行从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;
第一确定模块730,被配置为执行确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
第二确定模块740,被配置为执行基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符;
关键词确定模块750,被配置为执行根据所述目标字符,确定所述信息描述文本的关键词。
作为一种可选的实施方式,所述第一确定模块包括:
第一确定子模块,被配置为执行调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息;
第二确定子模块,被配置为执行基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。
作为一种可选的实施方式,所述第二确定模块包括:
获取子模块,被配置为执行获取所述信息描述文本属于所述内容类别标签的目标类别参数;
第三确定子模块,被配置为执行基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符;
第四确定子模块,被配置为执行根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
作为一种可选的实施方式,所述第四确定子模块包括:
候选确定单元,被配置为执行基于排序结果确定满足预设条件的目标候选字符;
目标确定单元,被配置为执行对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
作为一种可选的实施方式,所述装置还包括:
第二获取模块,被配置为执行从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同;
第三确定模块,被配置为执行获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度;
相应的,所述目标确定单元包括:
扩展确定子单元,被配置为执行基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度;
目标确定子单元,被配置为执行根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
作为一种可选的实施方式,所述关键词确定模块包括:
融合处理子模块,被配置为执行对所述目标字符进行融合处理,获得至少一个融合字符;
关键词确定子模块,被配置为执行将所述至少一个融合字符确定为所述信息描述文本的关键词。
作为一种可选的实施方式,所述装置还包括:
第二处理模块,被配置为执行对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
第四确定模块,被配置为执行确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
第五确定模块,被配置为执行基于每个所述信息描述组合文本对应的类别参数,确定满足预设条件的信息描述组合文本对应的目标替换字符;
相应的,所述关键词确定模块,被配置为执行根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供一种电子设备,电子设备包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一关键词确定方法的步骤。
该电子设备可以终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图8是根据一示例性实施例示出的一种用于关键词确定的电子设备的框图,该电子设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(CentralProcessing Units,CPU)810(处理器810可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器830,一个或一个以上存储应用程序823或数据822的存储介质820(例如一个或一个以上海量存储设备)。其中,存储器830和存储介质820可以是短暂存储或持久存储。存储在存储介质820的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器810可以设置为与存储介质820通信,在电子设备800上执行存储介质820中的一系列指令操作。
电子设备800还可以包括一个或一个以上电源860,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口840,和/或,一个或一个以上操作系统821,例如Windows Server,Mac OS X,Unix, Linux,FreeBSD等等。
输入输出接口840可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备800的通信供应商提供的无线网络。在一个实例中,输入输出接口840包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口840可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图8所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备800还可包括比图8中所示更多或者更少的组件,或者具有与图8所示不同的配置。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器,上述指令可由电子设备800的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现上述任一种实施方式中提供的方法。可选地,该计算机程序或指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机程序或指令,处理器执行该计算机程序或指令,使得该电子设备执行上述任一种实施方式中提供的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (16)
1.一种关键词确定方法,其特征在于,包括:
获取信息描述文本以及所述信息描述文本对应的内容类别标签;
从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;
确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符;
根据所述目标字符,确定所述信息描述文本的关键词。
2.根据权利要求1所述的关键词确定方法,其特征在于,所述确定每个所述信息描述子文本属于所述内容类别标签的类别参数包括:
调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息;
基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。
3.根据权利要求1所述的关键词确定方法,其特征在于,所述基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符包括:
获取所述信息描述文本属于所述内容类别标签的目标类别参数;
基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符;
根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
4.根据权利要求3所述的关键词确定方法,其特征在于,所述基于排序结果确定满足预设条件的目标字符包括:
基于排序结果确定满足预设条件的目标候选字符;
对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
5.根据权利要求4所述的关键词确定方法,其特征在于,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符步骤之前,所述方法还包括:
从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同;
获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度;
相应的,所述对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符包括:
基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度;
根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
6.根据权利要求1-5任一所述的关键词确定方法,其特征在于,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
对所述目标字符进行融合处理,获得至少一个融合字符;
将所述至少一个融合字符确定为所述信息描述文本的关键词。
7.根据权利要求1-5任一所述的关键词确定方法,其特征在于,所述方法还包括:
对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
基于每个所述信息描述组合文本对应的类别置参数,确定满足预设条件的信息描述组合文本对应的目标替换字符;
相应的,所述根据所述目标字符,确定所述信息描述文本的关键词包括:
根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
8.一种关键词确定装置,其特征在于,包括:
第一获取模块,被配置为执行获取信息描述文本以及所述信息描述文本对应的内容类别标签;
第一处理模块,被配置为执行从所述信息描述文本中抽取至少一个字符,获得多个信息描述子文本;
第一确定模块,被配置为执行确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
第二确定模块,被配置为执行基于每个所述信息描述子文本对应的类别参数,确定满足预设条件的信息描述子文本对应的目标字符;所述目标字符是所述信息描述文本中除抽取的字符之外的字符;
关键词确定模块,被配置为执行根据所述目标字符,确定所述信息描述文本的关键词。
9.根据权利要求8所述的关键词确定装置,其特征在于,所述第一确定模块包括:
第一确定子模块,被配置为执行调用类别分类模型,对每个所述信息描述子文本进行分类处理,确定每个所述信息描述子文本属于各内容类别的预测类别信息;
第二确定子模块,被配置为执行基于所确定的预测类别信息,确定每个所述信息描述子文本属于所述内容类别标签的类别参数;
其中,所述类别分类模型是利用信息描述样本文本和所述信息描述样本文本对应的样本内容类别标签训练得到。
10.根据权利要求8所述的关键词确定装置,其特征在于,所述第二确定模块包括:
获取子模块,被配置为执行获取所述信息描述文本属于所述内容类别标签的目标类别参数;
第三确定子模块,被配置为执行基于每个所述信息描述子文本对应的类别参数以及所述目标类别参数,确定每个所述信息描述子文本对应的候选字符的第一重要度;所述候选字符为所述信息描述文本中除抽取的字符之外的字符;
第四确定子模块,被配置为执行根据所述候选字符的第一重要度进行排序,并基于排序结果确定满足预设条件的目标字符。
11.根据权利要求10所述的关键词确定装置,其特征在于,所述第四确定子模块包括:
候选确定单元,被配置为执行基于排序结果确定满足预设条件的目标候选字符;
目标确定单元,被配置为执行对所述目标候选字符在所述信息描述文本和全部目标信息描述文本中进行聚合处理,并根据聚合处理结果,确定满足预设条件的目标字符;所述目标信息描述文本属于所述内容类别标签。
12.根据权利要求11所述的关键词确定装置,其特征在于,所述装置还包括:
第二获取模块,被配置为执行从信息库中获取属于所述内容类别标签的全部目标信息描述文本;所述目标信息描述文本与所述信息描述文本不同;
第三确定模块,被配置为执行获取所述目标信息描述文本对应的多个目标信息描述子文本,并确定每个所述目标信息描述子文本对应的候选字符的第二重要度;
相应的,所述目标确定单元包括:
扩展确定子单元,被配置为执行基于所述目标候选字符在所述信息描述文本对应的第一重要度,以及所述目标候选字符在全部所述目标信息描述文本对应的第二重要度,对所述目标候选字符进行聚合处理,获得每个目标候选字符对应的扩展重要度;
目标确定子单元,被配置为执行根据所述每个目标候选字符对应的扩展重要度,确定满足预设条件的目标字符。
13.根据权利要求8-12任一所述的关键词确定装置,其特征在于,所述关键词确定模块包括:
融合处理子模块,被配置为执行对所述目标字符进行融合处理,获得至少一个融合字符;
关键词确定子模块,被配置为执行将所述至少一个融合字符确定为所述信息描述文本的关键词。
14.根据权利要求8-12任一所述的关键词确定装置,其特征在于,所述装置还包括:
第二处理模块,被配置为执行对所述信息描述文本中至少一个字符进行位置替换处理,获得多个信息描述组合文本;
第四确定模块,被配置为执行确定每个所述信息描述组合文本属于所述内容类别标签的类别参数;
第五确定模块,被配置为执行基于每个所述信息描述组合文本对应的类别参数,确定满足预设条件的信息描述组合文本对应的目标替换字符;
相应的,所述关键词确定模块,被配置为执行根据所述信息描述子文本对应的目标字符和所述信息描述组合文本对应的目标替换字符,确定所述信息描述文本的关键词。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的关键词确定方法。
16.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至7中任一项所述的关键词确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111042705.6A CN113486184B (zh) | 2021-09-07 | 2021-09-07 | 关键词确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111042705.6A CN113486184B (zh) | 2021-09-07 | 2021-09-07 | 关键词确定方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113486184A true CN113486184A (zh) | 2021-10-08 |
CN113486184B CN113486184B (zh) | 2022-01-21 |
Family
ID=77946492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111042705.6A Active CN113486184B (zh) | 2021-09-07 | 2021-09-07 | 关键词确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113486184B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417331A (zh) * | 2021-12-30 | 2022-04-29 | 安天科技集团股份有限公司 | 病毒特征可信度的确定方法、装置、电子设备及存储介质 |
CN114818696A (zh) * | 2022-04-11 | 2022-07-29 | 北京三快在线科技有限公司 | 获取关键词的方法、装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160239561A1 (en) * | 2015-02-12 | 2016-08-18 | National Yunlin University Of Science And Technology | System and method for obtaining information, and storage device |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
CN109858036A (zh) * | 2019-02-26 | 2019-06-07 | 科大讯飞股份有限公司 | 一种文书划分方法及装置 |
CN111061838A (zh) * | 2019-12-18 | 2020-04-24 | 广东智媒云图科技股份有限公司 | 文本特征关键词确定方法、装置和存储介质 |
-
2021
- 2021-09-07 CN CN202111042705.6A patent/CN113486184B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160239561A1 (en) * | 2015-02-12 | 2016-08-18 | National Yunlin University Of Science And Technology | System and method for obtaining information, and storage device |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
CN109858036A (zh) * | 2019-02-26 | 2019-06-07 | 科大讯飞股份有限公司 | 一种文书划分方法及装置 |
CN111061838A (zh) * | 2019-12-18 | 2020-04-24 | 广东智媒云图科技股份有限公司 | 文本特征关键词确定方法、装置和存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417331A (zh) * | 2021-12-30 | 2022-04-29 | 安天科技集团股份有限公司 | 病毒特征可信度的确定方法、装置、电子设备及存储介质 |
CN114818696A (zh) * | 2022-04-11 | 2022-07-29 | 北京三快在线科技有限公司 | 获取关键词的方法、装置、存储介质及电子设备 |
CN114818696B (zh) * | 2022-04-11 | 2024-09-10 | 北京三快在线科技有限公司 | 获取关键词的方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113486184B (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7334395B2 (ja) | ビデオ分類方法、装置、機器、および記憶媒体 | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
CN110413875A (zh) | 一种文本信息推送的方法以及相关装置 | |
CN111104514A (zh) | 文档标签模型的训练方法及装置 | |
CN113486184B (zh) | 关键词确定方法、装置、设备及存储介质 | |
CN112559747B (zh) | 事件分类处理方法、装置、电子设备和存储介质 | |
CN112257452B (zh) | 情感识别模型的训练方法、装置、设备和存储介质 | |
CN111931500A (zh) | 搜索信息的处理方法、装置 | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
CN112330455A (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
CN111797622B (zh) | 用于生成属性信息的方法和装置 | |
CN113051914A (zh) | 一种基于多特征动态画像的企业隐藏标签抽取方法及装置 | |
CN113806588A (zh) | 搜索视频的方法和装置 | |
CN112749330A (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN113704507A (zh) | 数据处理方法、计算机设备以及可读存储介质 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN116882414B (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
CN110807097A (zh) | 分析数据的方法和装置 | |
CN115248890A (zh) | 用户兴趣画像的生成方法、装置、电子设备以及存储介质 | |
CN116955609A (zh) | 对象特征生成方法、装置、设备和存储介质 | |
WO2022262632A1 (zh) | 网页搜索方法、装置及存储介质 | |
CN117933260A (zh) | 一种文本质量分析方法、装置、设备及存储介质 | |
CN111125387B (zh) | 多媒体列表生成、命名方法、装置、电子设备和存储介质 | |
CN110110202A (zh) | 一种信息流推送方法及装置 | |
CN114461822A (zh) | 资源处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |