CN111191022B - 商品短标题生成方法及装置 - Google Patents
商品短标题生成方法及装置 Download PDFInfo
- Publication number
- CN111191022B CN111191022B CN201911373120.5A CN201911373120A CN111191022B CN 111191022 B CN111191022 B CN 111191022B CN 201911373120 A CN201911373120 A CN 201911373120A CN 111191022 B CN111191022 B CN 111191022B
- Authority
- CN
- China
- Prior art keywords
- keywords
- word
- commodity
- title
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Bakery Products And Manufacturing Methods Therefor (AREA)
- Confectionery (AREA)
- Control And Other Processes For Unpacking Of Materials (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开一种商品短标题生成方法及装置,涉及文本摘要技术领域,能够提高商品短标题的生成效率及精度。该方法包括:爬取商品标题数据和/或采集搜索词数据,构建语料数据集;基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;将词库中的各关键词按照词性标注为修饰词或品类词;获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题。该装置应用有上述方案所提的方法。
Description
技术领域
本发明涉及文本摘要技术领域,尤其涉及一种商品短标题生成方法及装置。
背景技术
商品短标题一般是由商品的标准长标题压缩而成,短标题顾名思义具有简洁短小的特点,旨在使用较少的字数对商品关键信息进行描述,使用户能够一目了然商品所要表示的商品关键信息,例如“韩版印花连衣裙”,这在自然语言处理上可以归类为一种特殊的文本摘要技术。
传统的文本摘要技术,例如TextRank,Lead-3等都是对文章进行摘要,抽取文章中的句子,这种方法无法很好应用到商品标题上。随着深度学习的快速发展,seq2seq,pointer-generation等各种深度学习模型能够生成压缩后的短标题。但是,在现实的场景中,尤其是在商品标题这一块,缺乏大量的短标题训练语料,使之无法在真实场景中广泛应用。
发明内容
本发明的目的在于提供一种商品短标题生成方法及装置,能够提高商品短标题的生成效率及精度。
为了实现上述目的,本发明的一方面提供一种商品短标题生成方法,包括:
爬取商品标题数据和/或采集搜索词数据,构建语料数据集;
基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;
将词库中的各关键词按照词性标注为修饰词或品类词;
获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;
从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题。
优选地,基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库的方法包括:
基于商品分类表将语料数据集中的多条语料按照商品类别逐条分类;
分别对多条语料分词得到多个关键词,将每个商品分类中的关键词去重后和过滤得到与商品分类一一对应的关键词集;
汇总多个关键词集组建词库。
较佳地,将词库中的各关键词按照词性标注为修饰词或品类词的方法包括:
采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注;和/或,
采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注。
进一步地,在采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
爬取新的商品标题数据分词后与词库中的关键词匹配;
当匹配成功的关键词数量小于阈值,则将新的商品标题数据中的关键词补入对应的关键词集,并对新补入的关键词进行词性标注;
当匹配成功的关键词数量大于阈值,则再次爬取新的商品标题数据分词后与词库中的关键词匹配。
优选地,采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
基于机器模型中的语义识别技术,从新爬取的商品标题数据中提取出属于修饰词或者品类词的关键词补入对应的关键词集,同时对新补入的关键词进行对应词性的标注。
优选地,获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词的方法包括:
识别原始商品标题数据中的商品分类,匹配对应的关键词集;
将原始商品标题数据分词为多个标题词,将各标题词分别与对应关键词集中的关键词进行匹配,筛选出匹配成功的关键词。
优选地,从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题的方法包括:
记录原始商品标题数据中各关键词的位置信息;
若标注为修饰词的关键词中存在词义范围交叉的多个关键词,仅保留交叉中的一个关键词;
若标注为修饰词的关键词中存在词义范围包含的多个关键词,仅保留词义范围大的关键词;
若标注为品类词的关键词的词义中包含有修饰词的关键词词义,则将对应的修饰词的关键词剔除;
将保留下的关键词定义为有效关键词,并按照有效关键词所在的位置顺序拼接成商品短标题。
可选地,将多个原始商品标题数据分别与词库匹配,并行处理后输出对应的多个商品短标题。
示例性,搜索词数据为用户在搜索商品时对应输入的搜索词的集合。
与现有技术相比,本发明提供的商品短标题生成方法具有以下有益效果:
本发明提供的商品短标题生成方法中,首先构建语料数据集,然后基于商品分类表将语料数据集中的语料进行分类,分类完成后提取出语料中的关键词共同组建词库,同时对词库中的各关键词按照词性标注为修饰词或品类词,至此词库建设完成,接下来可获取原始商品标题数据准备压缩,将原始商品标题数据分词后得到多个标题词,将这些标题词输入词库与关键词匹配,从匹配成功的关键词中筛选出至少两个有效关键词,将其按照词性顺序拼接后组成商品短标题。
可见,本发明采用将语料分类再标注的方案,能够有效降低标注过程的难度进而加快关键词标注的效率,通过将原始商品标题数据分词后直接与词库中的关键词匹配,经筛选拼接得到的商品短标题的准确性相对较高。
本发明的另一方面提供一种商品短标题生成装置,应用有上述技术方案提到的用于商品短标题生成方法,该装置包括:
数据采集单元,用于爬取商品标题数据和/或采集搜索词数据,构建语料数据集;
词库单元,用于基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;
词标注单元,用于将词库中的各关键词按照词性标注为修饰词或品类词;
词匹配单元,用于获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;
处理单元,用于从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题。
与现有技术相比,本发明提供的商品短标题生成装置的有益效果与上述技术方案提供的商品短标题生成方法的有益效果相同,在此不做赘述。
本发明的第三方面提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述商品短标题生成方法的步骤。
与现有技术相比,本发明提供的计算机可读存储介质的有益效果与上述技术方案提供的商品短标题生成方法的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为实施例一中商品短标题生成方法的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,均属于本发明保护的范围。
实施例一
请参阅图1,本实施例提供一种商品短标题生成方法,包括:
爬取商品标题数据和/或采集搜索词数据,构建语料数据集;基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;将词库中的各关键词按照词性标注为修饰词或品类词;获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题。
本实施例提供的商品短标题生成方法中,首先构建语料数据集,然后基于商品分类表将语料数据集中的语料进行分类,分类完成后提取出语料中的关键词共同组建词库,同时对词库中的各关键词按照词性标注为修饰词或品类词,至此词库建设完成,接下来可获取原始商品标题数据准备压缩,将原始商品标题数据分词后得到多个标题词,将这些标题词输入词库与关键词匹配,从匹配成功的关键词中筛选出至少两个有效关键词,将其按照词性顺序拼接后组成商品短标题。
可见,本实施例采用将语料分类再标注的方案,能够有效降低标注过程的难度进而加快关键词标注的效率,通过将原始商品标题数据分词后直接与词库中的关键词匹配,经筛选拼接得到的商品短标题的准确性相对较高。
需要说明的是,语料数据集的数据来源包括商品标题数据的爬取和搜索词数据的采集,对于商品标题数据需重点爬取各大电商平台的商品短标题,对于搜索词数据是指用户搜索各类商品对应输入的搜索词集合,也即query数据。
上述实施例中,基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库的方法包括:
基于商品分类表将语料数据集中的多条语料按照商品类别逐条分类;分别对多条语料分词得到多个关键词,将每个商品分类中的关键词去重后和过滤得到与商品分类一一对应的关键词集;汇总多个关键词集组建词库。
考虑到直接在语料上进行标注的工作量巨大,为了降低标注的难度并提高标注效率,首先将语料数据集中的语料按照商品分类表(如四级商品组)进行分类,例如分类结果包括上衣语料组、裤子语料组、手机语料组等,接着对分类的语料进行分词,使得每组分类中形成有多个关键词,对无关的关键词实现过滤(去除燥音关键词)后,再对每组分类中的关键词进行去重,以确保组内关键词的唯一性,最终形成与每组分类一一对应的关键词集,将全部关键词集汇总即可形成词库。
上述实施例中,将词库中的各关键词按照词性标注为修饰词或品类词的方法包括:
采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注;和/或,采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注。
顾名思义,人工标注即是指采用人工的方式识别出词库中各关键词是属于修饰词或者品类词,并手工完成相应标注。机器模型标注采用的是自动化识别标注技术,当词库中的关键词数据量巨大,可考虑采用机器模型方式来提升标注效率,实践发现机器模型的标注方式虽然效率高,但其标注的精度不如人工,因此在具体实施的过程中,优选两种结合的方式对词库中的关键词进行标注,如先使用机器模型对大量关键词预标注,然后采用人工方式校验,进而在提升关键词标注效率的同时均衡标注的精确度。
在采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
爬取新的商品标题数据分词后与词库中的关键词匹配;当匹配成功的关键词数量小于阈值,则将新的商品标题数据中的关键词补入对应的关键词集,并对新补入的关键词进行词性标注;当匹配成功的关键词数量大于阈值,则再次爬取新的商品标题数据分词后与词库中的关键词匹配。
上述实施例的目的在于扩充词库中的词源,通过不断获取新的商品标题数据,来检验词库中的关键词是否足够完善,具体过程为,首先将商品标题数据分词,过滤后仅保留词性为修饰词和品类词的相关关键词,当保留下来的关键词与词库中的关键词的数量小于阈值,则说明词库中的关键词还不够完善,可将未匹配成功的商品标题数据中的关键词补录入对应的关键词集中,同时对新补入的关键词进行词性标注,反之,当保留下来的关键词与词库中的关键词的数量大于阈值,则说明词库中的关键词足以应付该条商品标题数据,可以重新爬取新的商品标题数据重复上述过程继续检验词库。示例性地,阈值为3.
采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
基于机器模型中的语义识别技术,从新爬取的商品标题数据中提取出属于修饰词或者品类词的关键词补入对应的关键词集,同时对新补入的关键词进行对应词性的标注。
可选地,机器模型可选用BiLSTM+CRF的深度学习模型,通过深度学习模型从新爬取的商品标题数据中提取出属于修饰词或者品类词的关键词,标注后补入对应的关键词集,该深度学习模型具有很好的适应性,能够根据上下文的信息自动识别出商品标题中的品类词和修饰词。
进一步地,上述实施例中的获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词的方法包括:
识别原始商品标题数据中的商品分类,匹配对应的关键词集;将原始商品标题数据分词为多个标题词,将各标题词分别与对应关键词集中的关键词进行匹配,筛选出匹配成功的关键词。
优选地,可以同时获取多个原始商品标题数据分别与词库匹配,并行处理后输出对应的多个商品短标题。
具体实施时,同时识别出多个原始商品标题数据中的商品分类,并对应匹配到所属关键词集,将每个原始商品标题数据分词为多个标题词,将各标题词分别与对应关键词集中的关键词进行匹配,筛选出各原始商品标题数据匹配成功的关键词。
进一步地,上述实施例中从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题的方法包括:
记录原始商品标题数据中各关键词的位置信息;若标注为修饰词的关键词中存在词义范围交叉的多个关键词,仅保留交叉中的一个关键词;若标注为修饰词的关键词中存在词义范围包含的多个关键词,仅保留词义范围大的关键词;若标注为品类词的关键词的词义中包含有修饰词的关键词词义,则将对应的修饰词的关键词剔除;将保留下的关键词定义为有效关键词,并按照有效关键词所在的位置顺序拼接成商品短标题。具体实施过程中,优先处理原始商品标题数据中的品类词关键词。
可以理解的是,根据商品短标题的字数,筛选出符合条件的修饰词关键词和品类词关键词,把修饰词关键词和品类词关键词按照位置顺序拼接在一起,即可组成通顺的商品短标题,上述实施例仅为一个原始商品标题数据处理生成一个商品短标题的处理过程,当原始商品标题数据为多个时,同时执行多次上述处理过程即可,继而实现大批量的商品短标题。
实施例二
本实施例提供一种商品短标题生成装置,包括:
数据采集单元,用于爬取商品标题数据和/或采集搜索词数据,构建语料数据集;
词库单元,用于基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;
词标注单元,用于将词库中的各关键词按照词性标注为修饰词或品类词;
词匹配单元,用于获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;
处理单元,用于从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题。
与现有技术相比,本实施例提供的商品短标题生成装置的有益效果与上述实施例提供的商品短标题生成方法的有益效果相同,在此不做赘述。
实施例三
本实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述商品短标题生成方法的步骤。
与现有技术相比,本实施例提供的计算机可读存储介质的有益效果与上述技术方案提供的商品短标题生成方法的有益效果相同,在此不做赘述。
本领域普通技术人员可以理解,实现上述发明方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,上述程序可以存储于计算机可读取存储介质中,该程序在执行时,包括上述实施例方法的各步骤,上述的存储介质可以是:ROM/RAM、磁碟、光盘、存储卡等。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种商品短标题生成方法,其特征在于,包括:
爬取商品标题数据和/或采集搜索词数据,构建语料数据集;
基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;
将词库中的各关键词按照词性标注为修饰词或品类词;
获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;
从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题;
其中,所述从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题的步骤包括:
记录原始商品标题数据中各关键词的位置信息;
若标注为修饰词的关键词中存在词义范围交叉的多个关键词,仅保留交叉中的一个关键词;
若标注为修饰词的关键词中存在词义范围包含的多个关键词,仅保留词义范围大的关键词;
若标注为品类词的关键词的词义中包含有修饰词的关键词词义,则将对应的修饰词的关键词剔除;
将保留下的关键词定义为有效关键词,并按照有效关键词所在的位置顺序拼接成商品短标题。
2.根据权利要求1所述的方法,其特征在于,基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库的方法包括:
基于商品分类表将语料数据集中的多条语料按照商品类别逐条分类;
分别对多条语料分词得到多个关键词,将每个商品分类中的关键词去重后和过滤得到与商品分类一一对应的关键词集;
汇总多个关键词集组建词库。
3.根据权利要求2所述的方法,其特征在于,将词库中的各关键词按照词性标注为修饰词或品类词的方法包括:
采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注;和/或,
采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注。
4.根据权利要求3所述的方法,其特征在于,在采用人工标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
爬取新的商品标题数据分词后与词库中的关键词匹配;
当匹配成功的关键词数量小于阈值,则将新的商品标题数据中的关键词补入对应的关键词集,并对新补入的关键词进行词性标注;
当匹配成功的关键词数量大于阈值,则再次爬取新的商品标题数据分词后与词库中的关键词匹配。
5.根据权利要求3或4所述的方法,其特征在于,采用机器模型标注的方式,从词库中提取出属于修饰词或者品类词的关键词并进行对应词性的标注之后还包括:
基于机器模型中的语义识别技术,从新爬取的商品标题数据中提取出属于修饰词或者品类词的关键词补入对应的关键词集,同时对新补入的关键词进行对应词性的标注。
6.根据权利要求2-4任一项所述的方法,其特征在于,获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词的方法包括:
识别原始商品标题数据中的商品分类,匹配对应的关键词集;
将原始商品标题数据分词为多个标题词,将各标题词分别与对应关键词集中的关键词进行匹配,筛选出匹配成功的关键词。
7.根据权利要求1所述的方法,其特征在于,将多个原始商品标题数据分别与词库匹配,并行处理后输出对应的多个商品短标题。
8.根据权利要求1所述的方法,其特征在于,搜索词数据为用户在搜索商品时对应输入的搜索词的集合。
9.一种商品短标题生成装置,其特征在于,包括:
数据采集单元,用于爬取商品标题数据和/或采集搜索词数据,构建语料数据集;
词库单元,用于基于商品分类表将语料数据集中的多条语料按商品类别分类后,提取关键词组建词库;
词标注单元,用于将词库中的各关键词按照词性标注为修饰词或品类词;
词匹配单元,用于获取原始商品标题数据分词得到多个标题词,将各标题词分别与词库中的关键词匹配,输出匹配成功的关键词;
处理单元,用于从多个关键词中筛选出至少两个有效关键词,根据词性拼接组成商品短标题,其包括:记录原始商品标题数据中各关键词的位置信息;若标注为修饰词的关键词中存在词义范围交叉的多个关键词,仅保留交叉中的一个关键词;若标注为修饰词的关键词中存在词义范围包含的多个关键词,仅保留词义范围大的关键词;若标注为品类词的关键词的词义中包含有修饰词的关键词词义,则将对应的修饰词的关键词剔除;将保留下的关键词定义为有效关键词,并按照有效关键词所在的位置顺序拼接成商品短标题。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911373120.5A CN111191022B (zh) | 2019-12-27 | 2019-12-27 | 商品短标题生成方法及装置 |
CA3217669A CA3217669A1 (en) | 2019-12-27 | 2020-08-28 | Commodity short title generation method and apparatus |
CA3217721A CA3217721A1 (en) | 2019-12-27 | 2020-08-28 | Commodity short title generation method and apparatus |
PCT/CN2020/111943 WO2021128914A1 (zh) | 2019-12-27 | 2020-08-28 | 商品短标题生成方法及装置 |
CA3166094A CA3166094A1 (en) | 2019-12-27 | 2020-08-28 | Commodity short title generation method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911373120.5A CN111191022B (zh) | 2019-12-27 | 2019-12-27 | 商品短标题生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111191022A CN111191022A (zh) | 2020-05-22 |
CN111191022B true CN111191022B (zh) | 2023-07-25 |
Family
ID=70707711
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911373120.5A Active CN111191022B (zh) | 2019-12-27 | 2019-12-27 | 商品短标题生成方法及装置 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN111191022B (zh) |
CA (3) | CA3217721A1 (zh) |
WO (1) | WO2021128914A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191022B (zh) * | 2019-12-27 | 2023-07-25 | 苏宁云计算有限公司 | 商品短标题生成方法及装置 |
CN112446208A (zh) * | 2020-12-09 | 2021-03-05 | 北京有竹居网络技术有限公司 | 广告标题的生成方法、装置、设备和存储介质 |
CN112579776A (zh) * | 2020-12-21 | 2021-03-30 | 北京智齿博创科技有限公司 | 基于品类的质量问题场景标签的自动标注方法 |
CN113821718A (zh) * | 2021-02-01 | 2021-12-21 | 北京沃东天骏信息技术有限公司 | 一种物品信息推送方法和装置 |
CN113761114A (zh) * | 2021-03-03 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 短语生成方法、装置和计算机可读存储介质 |
CN113343687B (zh) * | 2021-05-25 | 2023-09-05 | 北京奇艺世纪科技有限公司 | 事件名称的确定方法、装置、设备及存储介质 |
CN113283218A (zh) * | 2021-06-24 | 2021-08-20 | 中国平安人寿保险股份有限公司 | 一种语义文本压缩方法及计算机设备 |
CN113553838A (zh) * | 2021-08-03 | 2021-10-26 | 稿定(厦门)科技有限公司 | 一种商品文案生成方法及装置 |
CN114387059A (zh) * | 2022-01-10 | 2022-04-22 | 北京达佳互联信息技术有限公司 | 信息处理方法、装置、终端以及计算机可读存储介质 |
CN115169337B (zh) * | 2022-08-24 | 2023-02-14 | 中教畅享(北京)科技有限公司 | 一种商品标题优化中关键词得分的计算方法 |
CN115470322B (zh) * | 2022-10-21 | 2023-05-05 | 深圳市快云科技有限公司 | 一种基于人工智能的关键词生成系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636334A (zh) * | 2013-11-06 | 2015-05-20 | 阿里巴巴集团控股有限公司 | 一种关键词推荐方法和装置 |
CN108804541A (zh) * | 2018-05-08 | 2018-11-13 | 苏州闻道网络科技股份有限公司 | 电商标题优化系统及优化方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8489609B1 (en) * | 2006-08-08 | 2013-07-16 | CastTV Inc. | Indexing multimedia web content |
CN102012915A (zh) * | 2010-11-22 | 2011-04-13 | 百度在线网络技术(北京)有限公司 | 一种文档共享平台的关键词推荐方法及系统 |
CN104424296B (zh) * | 2013-09-02 | 2018-07-31 | 阿里巴巴集团控股有限公司 | 查询词分类方法和装置 |
CN106708813A (zh) * | 2015-07-14 | 2017-05-24 | 阿里巴巴集团控股有限公司 | 一种标题处理方法及设备 |
KR20180069813A (ko) * | 2015-10-16 | 2018-06-25 | 알리바바 그룹 홀딩 리미티드 | 타이틀 표시 방법 및 장치 |
CN111191022B (zh) * | 2019-12-27 | 2023-07-25 | 苏宁云计算有限公司 | 商品短标题生成方法及装置 |
-
2019
- 2019-12-27 CN CN201911373120.5A patent/CN111191022B/zh active Active
-
2020
- 2020-08-28 CA CA3217721A patent/CA3217721A1/en active Pending
- 2020-08-28 CA CA3217669A patent/CA3217669A1/en active Pending
- 2020-08-28 WO PCT/CN2020/111943 patent/WO2021128914A1/zh active Application Filing
- 2020-08-28 CA CA3166094A patent/CA3166094A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636334A (zh) * | 2013-11-06 | 2015-05-20 | 阿里巴巴集团控股有限公司 | 一种关键词推荐方法和装置 |
CN108804541A (zh) * | 2018-05-08 | 2018-11-13 | 苏州闻道网络科技股份有限公司 | 电商标题优化系统及优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111191022A (zh) | 2020-05-22 |
CA3217721A1 (en) | 2021-07-01 |
CA3166094A1 (en) | 2021-07-01 |
WO2021128914A1 (zh) | 2021-07-01 |
CA3217669A1 (en) | 2021-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111191022B (zh) | 商品短标题生成方法及装置 | |
CN106649818B (zh) | 应用搜索意图的识别方法、装置、应用搜索方法和服务器 | |
CN109388795B (zh) | 一种命名实体识别方法、语言识别方法及系统 | |
CN102479191B (zh) | 提供多粒度分词结果的方法及其装置 | |
CN111046656B (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN108038099B (zh) | 基于词聚类的低频关键词识别方法 | |
CN107943786B (zh) | 一种中文命名实体识别方法及系统 | |
CN106570180A (zh) | 基于人工智能的语音搜索方法及装置 | |
CN108920482B (zh) | 基于词汇链特征扩展和lda模型的微博短文本分类方法 | |
CN109241332B (zh) | 一种通过语音确定语义的方法及系统 | |
CN113468339B (zh) | 基于知识图谱的标签提取方法、系统、电子设备及介质 | |
CN109446313B (zh) | 一种基于自然语言分析的排序系统及方法 | |
CN110196910B (zh) | 一种语料分类的方法及装置 | |
CN108875743B (zh) | 一种文本识别方法及装置 | |
CN110674297B (zh) | 舆情文本分类模型构建和舆情文本分类方法、装置及设备 | |
US9652997B2 (en) | Method and apparatus for building emotion basis lexeme information on an emotion lexicon comprising calculation of an emotion strength for each lexeme | |
CN114911917A (zh) | 资产元信息搜索方法、装置、计算机设备及可读存储介质 | |
CN108228612B (zh) | 一种提取网络事件关键词以及情绪倾向的方法及装置 | |
CN104035955B (zh) | 搜索方法和装置 | |
CN110874408B (zh) | 模型训练方法、文本识别方法、装置及计算设备 | |
CN115858773A (zh) | 适用于长文档的关键词挖掘方法、装置及介质 | |
CN110705285A (zh) | 一种政务文本主题词库构建方法、装置、服务器及可读存储介质 | |
CN117648926A (zh) | 一种基于自然语言自动创建数据模型的方法及系统 | |
CN116522905B (zh) | 文本纠错方法、装置、设备、可读存储介质及程序产品 | |
CN112949293A (zh) | 一种相似文本生成方法、相似文本生成装置及智能设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |