CN108133012B - 一种标签设置方法及装置 - Google Patents
一种标签设置方法及装置 Download PDFInfo
- Publication number
- CN108133012B CN108133012B CN201711407172.0A CN201711407172A CN108133012B CN 108133012 B CN108133012 B CN 108133012B CN 201711407172 A CN201711407172 A CN 201711407172A CN 108133012 B CN108133012 B CN 108133012B
- Authority
- CN
- China
- Prior art keywords
- character string
- target
- label
- candidate character
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明提供了一种标签设置方法及装置,该方法包括:根据用户的至少一个习惯用词设置至少一个标签;建立至少一个样本关键词与至少一个标签之间的映射关系;确定所述用户获取的待设置标签信息;对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;根据所述映射关系,确定出所述目标关键词对应的标签;为所述待设置标签信息设置所确定的标签。因此,本发明提供的方案可以提高标签与用户用词习惯的匹配度。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种标签设置方法及装置。
背景技术
随着信息时代的到来,信息量成几何级数的增长。为了对数量巨大的信息进行有效的管理。通常采用为信息设置的标签的方式来对信息进行归类或区分。
目前,为信息设置标签的方法通常为:采用人工手动的方式从信息中提取一个字符串,并将所提取的字符串确定为信息的标签。但是,确定出的标签的用词可能与用户的习惯用词不同,从而导致用户利用此类标签对信息管理起来较为困难。因此,现有的方式,标签与用户的用词习惯匹配度较低。
发明内容
本发明实施例提供了一种标签设置方法及装置,可以提高标签与用户用词习惯的匹配度。
第一方面,本发明实施例提供了一种标签设置方法,该方法可以包括:
根据用户的至少一个习惯用词设置至少一个标签;
建立至少一个样本关键词与至少一个标签之间的映射关系;
确定所述用户获取的待设置标签信息;
对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
根据所述映射关系,确定出所述目标关键词对应的标签;
为所述待设置标签信息设置所确定的标签。
优选地,
所述对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,包括:
获取所述待设置标签信息的标题;
判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
针对每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
判断是否存在被标记的第一待选字符串;
如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
优选地,
所述对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,包括:
获取所述待设置标签信息的内容;
确定所述内容中包括的至少一条语句;
针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
在各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
判断是否存在被标记的目标待选字符串;
如果是,从被标记的目标待选字符串中,抓取所述目标关键词。
优选地,
所述至少一个样本关键词具有设定的优先级顺序;
所述从被标记的目标待选字符串中,抓取所述目标关键词,包括:
判断被标记的目标待选字符串的数量是否为1;
如果是,抓取被标记的目标待选字符串作为所述目标关键词;
否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词。
优选地,
进一步包括:
在判断出不存在被标记的目标待选字符串时,
记录所述至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
第二方面,本发明实施例提供了一种标签设置装置,该装置可以包括:
建立模块,用于根据用户的至少一个习惯用词设置至少一个标签;建立至少一个样本关键词与至少一个标签之间的映射关系;
信息确定模块,用于确定所述用户获取的待设置标签信息;
抓取模块,用于对所述信息确定模块获取的所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
标签确定模块,用于根据所述建立模块建立的所述映射关系,确定出所述抓取模块抓取的所述目标关键词对应的标签;
设置模块,用于为所述待设置标签信息设置所述标签确定模块所确定的标签。
优选地,
所述抓取模块,包括:标题分词子模块、第一判断子模块以及第一抓取子模块;
所述标题分词子模块,用于获取所述待设置标签信息的标题;判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
所述第一判断子模块,用于针对所述标题分词子模块划分的每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
所述第一抓取子模块,用于判断是否存在被所述第一判断子模块标记的第一待选字符串;如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
优选地,
所述抓取模块,包括:内容分词子模块、第二判断子模块以及第二抓取子模块;
所述内容分词子模块,用于获取所述待设置标签信息的内容;确定所述内容中包括的至少一条语句;针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
所述第二判断子模块,用于在所述内容分词子模块划分的各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
所述第二抓取子模块,用于判断是否存在被所述第二判断子模块标记的目标待选字符串;如果是,从被标记的目标待选字符串中,抓取所述目标关键词。
优选地,
在所述至少一个样本关键词具有设定的优先级顺序时,
则,所述第二抓取子模块,用于判断被标记的目标待选字符串的数量是否为1;如果是,抓取被标记的目标待选字符串作为所述目标关键词;否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词。
优选地,
所述抓取模块,进一步包括:报告子模块;
所述报告子模块,用于在所述第二抓取子模块判断出不存在被标记的目标待选字符串时,记录所述至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
本发明实施例提供了一种标签设置方法及装置,首先根据用户提供的习惯用词设置标签,然后建立样本关键词与所设置标签之间的映射关系。在确定出用户获取的待设置标签信息时,对所获取的待设置标签信息进行分词处理。并根据分词处理结果抓取出待设置标签信息的目标关键词。然后根据样本关键词与标签之间的映射关系,确定出目标关键词对应的标签。最后为待设置标签信息设置所确定的标签。通过上述可知,本方案中在抓取出待设置标签信息的目标关键词之后,可以根据样本关键词与标签之间的映射关系,为待设置标签信息设置标签。由于样本关键词与标签之间的映射关系中所涉及的标签是根据用户提供的习惯用词设置的。因此,本发明实施例提供的方案可以提高标签与用户用词习惯的匹配度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种标签设置方法的流程图;
图2是本发明另一个实施例提供的一种标签设置方法的流程图;
图3是本发明又一个实施例提供的一种标签设置方法的流程图;
图4是本发明又一个实施例提供的一种标签设置方法的流程图;
图5是本发明一个实施例提供的一种标签设置装置所在设备的一种硬件结构图;
图6是本发明一个实施例提供的一种标签设置装置的结构示意图;
图7是本发明另一个实施例提供的一种标签设置装置的结构示意图;
图8是本发明又一个实施例提供的一种标签设置装置的结构示意图;
图9是本发明又一个实施例提供的一种标签设置装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种标签设置方法,该方法可以包括以下步骤:
步骤101:根据用户的至少一个习惯用词设置至少一个标签;
步骤102:建立至少一个样本关键词与至少一个标签之间的映射关系;
步骤103:确定所述用户获取的待设置标签信息;
步骤104:对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
步骤105:根据所述映射关系,确定出所述目标关键词对应的标签;
步骤106:为所述待设置标签信息设置所确定的标签。
根据图1所示的实施例,首先根据用户提供的习惯用词设置标签,然后建立样本关键词与所设置标签之间的映射关系。在确定出用户获取的待设置标签信息时,对所获取的待设置标签信息进行分词处理。并根据分词处理结果抓取出待设置标签信息的目标关键词。然后根据样本关键词与标签之间的映射关系,确定出目标关键词对应的标签。最后为待设置标签信息设置所确定的标签。通过上述可知,本方案中在抓取出待设置标签信息的目标关键词之后,可以根据样本关键词与标签之间的映射关系,为待设置标签信息设置标签。由于样本关键词与标签之间的映射关系中所涉及的标签是根据用户提供的习惯用词设置的,因此,本发明实施例提供的方案可以提高标签与用户用词习惯的匹配度。
在本发明一个实施例,上述图1所示流程图中步骤101所涉及的习惯用词的获取方式至少可以存在两种:
第一种:至少一个习惯用词是由用户直接提供的。
第二种:通过监测用户的用词频率,获取至少一个习惯用词。
在本发明一个实施例,根据用户的至少一个习惯用词设置至少一个标签的方法至少存在以下两种:
第一种,直接将习惯用语设置为标签。比如,存在一个习惯用语“煤改气”,则将煤改气直接设置为标签。
第二种,确定习惯用语所属类别,将所属类别确定为标签。比如存在一个习惯用语“AA燃气公司”,确定“AA燃气公司”所属类别为“竞争对手”,则将“竞争对手”确定为标签。
在本发明一个实施例中,上述图1所示流程图中步骤102所涉及的至少一个样本关键词与至少一个标签之间的映射关系可以根据业务要求确定。在映射关系中,可以一个样本关键词分别对应一个标签,也可以多个样本关键词对应一个标签。
在本实施例中,比如存在样本关键词“AA燃气公司”以及“BB燃气公司”,将“AA燃气公司”以及“BB燃气公司”与标签“竞争对手”建立映射关系。
在本实施例中,比如存在样本关键词“气代煤”,将“气代煤”与标签“煤改气”建立映射关系。
在本发明一个实施例中,上述图1所示流程图中的步骤104对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词的实现方式至少存在以下两种:
方式一:获取待设置标签信息的内容,对内容进行分词处理,抓取待设置标签信息的目标关键词;
方式二:获取待设置标签信息的标题,对标题进行分词处理,抓取待设置标签信息的目标关键词。
针对于上述的方式一,存在如下实施例:
在本发明一个实施例中,上述图1所示流程图中的步骤104对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,可以包括:
获取所述待设置标签信息的内容;
确定所述内容中包括的至少一条语句;
针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
在各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
判断是否存在被标记的目标待选字符串;
如果是,从被标记的目标待选字符串中,抓取所述目标关键词。
在本实施例中,确定内容中包括的至少一条语句可以通过如下方法实现:预设设定分隔符,利用分隔符确定出内容包括的至少一条语句。分隔符可以根据业务要求确定。比如可以包括但不限于逗号、句号、分号、冒号、顿号、空格、问号、感叹号、分隔符中的至少一种或多种。
在本实施例中,将语句划分成至少一个第二待选字符串可以包括但不限于如下方法实现:可以按照语句的读写顺序,依次将该语句包括的每一个字符作为当前字符。然后将当前字符作为首位字符,在其后面追加当前字符相邻的下一个字符,然后作为一个第二待选字符串。遍历追加后续字符的过程,至到遍历到该语句的最后一个字符。比如:存在语句“AC燃气公司启动项目B”,则根据该语句读写顺序,首先将A作为首位字符,形成的第二待选字符串包括:AC、AC燃、AC燃气、AC燃气公、AC燃气公司、AC燃气公司启、AC燃气公司启动、AC燃气公司启动项、AC燃气公司启动项目、AC燃气公司启动项目B。依次类推,直至将该语句包括的最后一个字符B作为当前字符为止。
在本实施例中,在各个语句被划分成各个第二待选字符串之后,统计每一个第二待选字符串在内容中出现的次数。将出现最多的第二待选字符串确定为目标待选字符串。比如只有一个第二待选字符串出现的次数最多,则直接将该第二待选字符串确定为目标字符串。比如有至少两个第二待选字符串出现的次数相同,且次数最多,则将这些第二待选字符串均确定为目标第二待选字符串。
在本实施例中,在确定出目标待选字符串之后,需要在各个样本关键词中查找各个目标待选字符串,只有在样本关键词中能查找到目标待选字符串时,才说明该样本关键词存在具有映射关系的标签。因此,需要对在各个样本关键词中能查找到的目标待选字符串进行标记,以便可以在标记的目标待选字符串中抓取出目标关键词。
根据上述实施例,从待设置标签信息的内容中抓取关键词。因此抓取出的关键词可以真实的反映出待设置标签信息所表述的主要内容。
在本发明一个实施例中,在上述图1所示流程图中所涉及的至少一个样本关键词具有设定的优先级顺序时,
上一个实施例中的步骤从被标记的目标待选字符串中,抓取所述目标关键词,可以包括:
判断被标记的目标待选字符串的数量是否为1;
如果是,抓取被标记的目标待选字符串作为所述目标关键词;
否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词。
在本实施例中,样本关键词的优先级顺序可以根据业务要求确定。比如,可以根据样本关键词使用频率由高到低的顺序确定出各个样本关键词的优先级顺序。比如,可以根据样本关键词重要性由高到低的顺序确定出各个样本关键词的优先级顺序。
在本实施例中,在标记过的目标待选字符串的数量为一个时,则直接抓取为目标关键词。在被标记过的目标待选字符串的数据大于一个时,则根据各个样本关键词的优先级顺序确定出每一个目标待选字符串对应的优先级,然后抓取优先级最高的目标待选字符串作为目标关键词。
根据上述实施例,在被标记过的目标待选字符串的数量大于1时,需要根据各个样本关键词的优先级顺序,确定出各个目标待选字符串的优先级。并抓取出优先级最高的目标待选字符串作为目标关键词。因此,抓取的目标关键词能够最大限度的满足用户优先级需求。
在本发明一个实施例中,在步骤判断是否存在被标记的目标待选字符串之后,可以进一步包括:
在判断出不存在被标记的目标待选字符串时,
记录所述至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
在本实施例中,时间区间以及阈值均可以根据业务要求确定。比如时间区间可以为1个星期,阈值可以为5次。
在本实施例中,在确定出在设定的时间区间内,目标待选字符串被记录的累计次数达到预先设定阈值时,说明该目标待选字符串出现的频率较高,可以生成将该目标待选字符串设置为样本关键词的添加报告。以使用户根据添加报告确定是否将目标待选字符串设置为样本关键词。如果用户不需要将该目标待选字符串设置为样本关键词,则用户可不做添加处理。如果用户需要将该目标待选字符串设置为样本关键词,则将该目标待选字符串确定为样本关键词,并为其设置具有映射关系的标签。待设置完成后更新各个样本关键词与各个标签的映射关系。
根据上述实施例,在判断出没有被标记过的待选字符串时,记录各个待选字符串,并根据待选字符串在设定时间区间内的累计被记录次数,确定是否生成将待选字符串设置为样本关键词的添加报告。以使用户可以根据及时根据添加报告判断是否更新样本关键词以及更新与样本关键词具有映射关系的标签。
下面以存在待设置标签信息1为例,对标签设置方法进行说明。如图2所示,该标签设置方法包括:
步骤201:根据用户的至少一个习惯用词设置至少一个标签。
在本步骤中,下面以至少一个习惯用词中包括“煤改气”和“煤改电”为例进行说明:将“煤改气”设置为标签“煤改气”;将“煤改电”设置为标签“煤改电”。
步骤202:建立至少一个样本关键词与至少一个标签之间的映射关系,其中,至少一个样本关键词具有设定的优先级顺序。
在本步骤中,建立样本关键词“气代煤”与标签“煤改气”之间的映射关系,以及建立样本关键词“电代煤”与标签“煤改电”之间的映射关系。其中,“气代煤”优先级高于“电代煤”。
步骤203:确定用户获取的待设置标签信息。
在本步骤中,确定待设置标签信息1。
步骤204:获取待设置标签信息的内容。
在本步骤中,获取待设置标签信息1的内容。
步骤205:确定内容中包括的至少一条语句。
步骤206:针对每一条语句均执行:将当前语句划分成至少一个第二待选字符串;其中,每一个第二待选字符串包括当前语句中的至少两个相邻的字符。
步骤207:在各个第二待选字符串中,选择出在内容中出现次数最多的至少一个目标待选字符串。
在本步骤中,确定出第二待选字符串中“电代煤”以及“气代煤”在内容中出现的次数相同,且次数最多。则将“电代煤”以及“气代煤”确定为目标待选字符串。
步骤208:针对每一个目标待选字符串均执行,判断在至少一个样本关键词中是否能查找到当前目标待选字符串,如果是,标记当前目标待选字符串。
在本步骤中,判断出“电代煤”以及“气代煤”均能在样本关键词中查找到,所以均被标记。
步骤209:判断是否存在被标记的目标待选字符串,如果是,执行步骤210;否则,执行步骤215。
在本步骤中,判断出存在被标记的目标待选字符串“电代煤”以及“气代煤”。
步骤210:判断被标记的目标待选字符串的数量是否为1,如果是,执行步骤211;否则,执行步骤212。
在本步骤中,判断出被标记的目标待选字符串的数量大于1,执行步骤212。
步骤211:抓取被标记的目标待选字符串作为目标关键词,并执行步骤213。
步骤212:根据优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为目标关键词。
在本步骤中,由于“气代煤”优先级高于“电代煤”,则抓取优先级最高的目标待选字符串“气代煤”作为目标关键词。
步骤213:根据映射关系,确定出目标关键词对应的标签。
在本步骤中,根据步骤202中建立的映射关系,确定出目标关键词“气代煤”对应的标签为“煤改气”。
步骤214:为待设置标签信息设置所确定的标签。
在本步骤中,为待设置标签信息设置标签“煤改气”。
步骤215:记录各个目标待选字符串。
步骤216:在各个被记录的目标待选字符串中,选择一个目标待选字符串作为当前目标待选字符串。
步骤217:确定在设定的时间区间内,当前目标待选字符串被记录的累计次数。
步骤218:判断累计次数是否达到设定的阈值,如果是,执行步骤219;否则,执行步骤220。
步骤219:生成将当前目标待选字符串设置为样本关键词的添加报告。
步骤220:判断当前目标待选字符是否为最后一个目标待选字符,如果是,结束当前流程;否则,执行步骤216。
针对于上述的方式二,存在如下实施例:
在本发明一个实施例中,上述图1所示流程图中的步骤104对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,可以包括:
获取所述待设置标签信息的标题;
判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
针对每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
判断是否存在被标记的第一待选字符串;
如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
在本步骤中,在判断出标题中包括的字符的数量少于两个时,则说明标题中可能只存在单个字符。由于单个字符能够表达出的意思较为单一,因此不能根据其确定出关键词,因此,不再对待设置标签信息进行标签设置操作。
在本实施例中,将标题划分成至少一个第一待选字符串的实现方法与上述将语句划分成至少一个第二待选字符串的实现方法基本相同,因此,在本实施例中将不再赘述。
根据上述实施例,从待设置标签信息的标题中抓取关键词。因此抓取出的关键词可以真实的反映出待设置标签信息的主题。
在本发明一个实施例中,在上述图1所示流程图中所涉及的至少一个样本关键词具有设定的优先级顺序时,
上一个实施例中的步骤从被标记的第一待选字符串中,抓取所述目标关键词,可以包括:
判断被标记的第一待选字符串的数量是否为1;
如果是,抓取被标记的第一待选字符串作为所述目标关键词;
否则,根据所述优先级顺序,从被标记的第一待选字符串中,抓取优先级最高的第一待选字符串作为所述目标关键词。
在本实施例中,从被标记的第一待选字符串中抓取所述目标关键词的实现方法与上述实施例中的从被标记的目标待选字符串中抓取所述目标关键词的实现方法基本相同,因此,在本实施例中将不再赘述。
在本发明一个实施例中,在步骤判断是否存在被标记的第一待选字符串之后,可以进一步包括:
在判断出不存在被标记的第一待选字符串时,
记录所述至少一个第一待选字符串;
针对每一个所述第一待选字符串均执行,确定在设定的时间区间内,当前所述第一待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述第一待选字符串设置为样本关键词的添加报告。
在本实施例的实现方法与上述实施例中生成将目标待选字符串设置为样本关键词的添加报告的实现方法基本相同,因此,在本实施例中将不再赘述。
下面以存在待设置标签信息2为例,对标签设置方法进行说明。如图3所示,该标签设置方法包括:
步骤301:根据用户的至少一个习惯用词设置至少一个标签。
在本步骤中,下面以至少一个习惯用词中包括“AA燃气公司”为例进行说明:将“AA燃气公司”设置为标签“竞争对手”。
步骤302:建立至少一个样本关键词与至少一个标签之间的映射关系,其中,至少一个样本关键词具有设定的优先级顺序。
在本步骤中,建立样本关键词“AA燃气”与标签“竞争对手”之间的映射关系。
步骤303:确定用户获取的待设置标签信息。
在本步骤中,获取待设置标签信息2。
步骤304:获取待设置标签信息的标题。
在本步骤中,获取待设置标签信息2的标题。
步骤305:判断标题中包括的字符的数量是否不少于两个,如果是,执行步骤306;否则,结束当前流程。
在本步骤中,判断出标题中包括的字符数量不少于两个,执行步骤306。
步骤306:将标题划分成至少一个第一待选字符串;其中,每一个第一待选字符串包括标题中的至少两个相邻的字符。
在本步骤中,比如将标题划分成的各个第一待选字符串中包括“AA燃气”、“气代煤”。
步骤307:针对每一个第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前第一待选字符串。
在本步骤中,判断出“AA燃气”能在样本关键词中查找到,所以被标记。
步骤308:判断是否存在被标记的第一待选字符串,如果是,执行步骤309;否则,执行步骤314。
在本步骤中,判断出存在“AA燃气”被标记。
步骤309:判断被标记的第一待选字符串的数量是否为1,如果是,执行步骤310;否则,执行步骤311。
在本步骤中,判断出被标记的待选字符串的数量为1,执行步骤310。
步骤310:抓取被标记的第一待选字符串作为目标关键词,并执行步骤312。
在本步骤中,抓取“AA燃气”作为目标关键词。
步骤311:根据优先级顺序,从被标记的第一待选字符串中,抓取优先级最高的第一待选字符串作为目标关键词。
步骤312:根据映射关系,确定出目标关键词对应的标签。
在本步骤中,根据映射关系,确定出目标关键词“AA燃气”对应的标签为“竞争对手”。
步骤313:为待设置标签信息设置所确定的标签。
在本步骤中,为待设置标签信息2设置标签“竞争对手”。
步骤314:记录各个第一待选字符串。
步骤315:在各个被记录的第一待选字符串中,选择一个第一待选字符串作为当前第一待选字符串。
步骤316:确定在设定的时间区间内,当前第一待选字符串被记录的累计次数。
步骤317:判断累计次数是否达到设定的阈值,如果是,执行步骤318;否则,执行步骤319。
步骤318:生成将当前第一待选字符串设置为样本关键词的添加报告。
步骤319:判断当前第一待选字符是否为最后一个第一待选字符,如果是,结束当前流程;否则,执行步骤315。
在本发明一个实施例中,上述图2与图3所示的流程可以相结合来实现标签设置方法。
下面以存在待设置标签信息3为例,对标签设置方法进行说明。如图4所示,该标签设置方法包括:
步骤401:根据用户的至少一个习惯用词设置至少一个标签。
步骤402:建立至少一个样本关键词与至少一个标签之间的映射关系,其中,至少一个样本关键词具有设定的优先级顺序。
步骤403:确定用户获取的待设置标签信息。
步骤404:获取待设置标签信息的标题。
步骤405:判断标题中包括的字符的数量是否不少于两个,如果是,执行步骤406;否则,结束当前流程。
步骤406:将标题划分成至少一个第一待选字符串;其中,每一个第一待选字符串包括标题中的至少两个相邻的字符。
步骤407:针对每一个第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前第一待选字符串。
步骤408:判断是否存在被标记的第一待选字符串,如果是,执行步骤409;否则,执行步骤420以及步骤414。
步骤409:判断被标记的待选字符串的数量是否为1,如果是,执行步骤410;否则,执行步骤411。
步骤410:抓取被标记的待选字符串作为目标关键词,并执行步骤412。
步骤411:根据优先级顺序,从被标记的待选字符串中,抓取优先级最高的待选字符串作为目标关键词。
步骤412:根据映射关系,确定出目标关键词对应的标签。
步骤413:为待设置标签信息设置所确定的标签。
步骤414:记录各个待选字符串。
步骤415:在各个被记录的待选字符串中,选择一个待选字符串作为当前待选字符串。
步骤416:确定在设定的时间区间内,当前待选字符串被记录的累计次数。
步骤417:判断累计次数是否达到设定的阈值,如果是,执行步骤418;否则,执行步骤419。
步骤418:生成将当前待选字符串设置为样本关键词的添加报告。
步骤419:判断当前待选字符串是否为最后一个待选字符串,如果是,结束当前流程;否则,执行步骤415。
步骤420:获取待设置标签信息的内容。
步骤421:确定内容中包括的至少一条语句。
步骤422:针对每一条语句均执行:将当前语句划分成至少一个第二待选字符串;其中,每一个第二待选字符串包括当前语句中的至少两个相邻的字符。
步骤423:在各个第二待选字符串中,选择出在内容中出现次数最多的至少一个目标待选字符串。
步骤424:针对每一个目标待选字符串均执行,判断在至少一个样本关键词中是否能查找到当前目标待选字符串,如果是,标记当前目标待选字符串。
步骤425:判断是否存在被标记的目标待选字符串,如果是,执行步骤409;否则,执行步骤414。
如图5、图6所示,本发明实施例提供了一种标签设置装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图5所示,为本发明实施例提供的标签设置装置所在设备的一种硬件结构图,除了图5所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图6所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的标签设置装置,包括:
建立模块601,用于根据用户的至少一个习惯用词设置至少一个标签;建立至少一个样本关键词与至少一个标签之间的映射关系;
信息确定模块602,用于确定所述用户获取的待设置标签信息;
抓取模块603,用于对所述信息确定模块602获取的所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
标签确定模块604,用于根据所述建立模块601建立的所述映射关系,确定出所述抓取模块603抓取的所述目标关键词对应的标签;
设置模块605,用于为所述待设置标签信息设置所述标签确定模块604所确定的标签。
根据图6所示的实施例,本方案中在抓取出待设置标签信息的目标关键词之后,可以根据样本关键词与标签之间的映射关系,为待设置标签信息设置标签。由于样本关键词与标签之间的映射关系中所涉及的标签是根据用户提供的习惯用词设置的。因此,本发明实施例提供的方案可以提高标签与用户用词习惯的匹配度。
在本发明一个实施例中,上述图6所示结构示意图中的抓取模块603在执行对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词的实现方式至少存在以下两种:方式一:获取待设置标签信息的内容,对内容进行分词处理,抓取待设置标签信息的目标关键词;方式二:获取待设置标签信息的标题,对标题进行分词处理,抓取待设置标签信息的目标关键词。因此,抓取模块603也可以存在如下两种结构:
针对于结构一,标签设置装置存在如图7所示的结构:
在本发明一个实施例中,如图7所示,所述抓取模块603可以包括:内容分词子模块6031a、第二判断子模块6032a以及第二抓取子模块6033a;
所述内容分词子模块6031a,用于获取所述待设置标签信息的内容;确定所述内容中包括的至少一条语句;针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
所述第二判断子模块6032a,用于在所述内容分词子模块划分的各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
所述第二抓取子模块6033a,用于判断是否存在被所述第二判断子模块6032a标记的目标待选字符串;如果是,从被标记的目标待选字符串中,抓取所述目标关键词。
在本发明一个实施例中,如图7所示,在所述至少一个样本关键词具有设定的优先级顺序时,
则,所述第二抓取子模块6033a,用于判断被标记的目标待选字符串的数量是否为1;如果是,抓取被标记的目标待选字符串作为所述目标关键词;否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词。
在本发明一个实施例中,如图7所示,所述抓取模块603可以进一步包括:报告子模块6034a;
所述报告子模块6034a,用于在所述第二抓取子模块6033a判断出不存在被标记的目标待选字符串时,记录所述至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
针对于结构二,标签设置装置存在如图8所示的结构:
在本发明一个实施例中,如图8所示,所述抓取模块603可以包括:标题分词子模块6031b、第一判断子模块6032b以及第一抓取子模块6033b;
所述标题分词子模块6031b,用于获取所述待设置标签信息的标题;判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
所述第一判断子模块6032b,用于针对所述标题分词子模块划分的每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
所述第一抓取子模块6033b,用于判断是否存在被所述第一判断子模块6032b标记的第一待选字符串;如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
在本发明一个实施例中,如图8所示,在所述至少一个样本关键词具有设定的优先级顺序时,则,所述第一抓取子模块6033b,用于判断被标记的第一待选字符串的数量是否为1;如果是,抓取被标记的第一待选字符串作为所述目标关键词;否则,根据所述优先级顺序,从被标记的第一待选字符串中,抓取优先级最高的第一待选字符串作为所述目标关键词。
在本发明一个实施例中,如图8所示,所述抓取模块603可以进一步包括:目标报告子模块6034b;
所述目标报告子模块6034b,用于在所述第一抓取子模块6033b判断出不存在被标记的第一待选字符串时,记录所述至少一个第一待选字符串;针对每一个所述第一待选字符串均执行,确定在设定的时间区间内,当前所述第一待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述第一待选字符串设置为样本关键词的添加报告。
在本发明一个实施例中,如图9所示,为上述图7与图8所示的结构图相结合来实现的标签设置装置。
在本发明一个实施例提供了一种可读介质,该可读介质包括:执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行上述任一项所述的标签设置方法。
在本发明一个实施例提供了一种存储控制器,该存储控制器包括:处理器、存储器和总线;所述存储器用于存储执行指令;所述处理器与所述存储器通过所述总线连接;当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行上述任一项所述的标签设置方法。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明各个实施例至少可以实现如下有益效果:
1、在本发明实施例中,首先根据用户提供的习惯用词设置标签,然后建立样本关键词与所设置标签之间的映射关系。在确定出用户获取的待设置标签信息时,对所获取的待设置标签信息进行分词处理。并根据分词处理结果抓取出待设置标签信息的目标关键词。然后根据样本关键词与标签之间的映射关系,确定出目标关键词对应的标签。最后为待设置标签信息设置所确定的标签。通过上述可知,本方案中在抓取出待设置标签信息的目标关键词之后,可以根据样本关键词与标签之间的映射关系,为待设置标签信息设置标签。由于样本关键词与标签之间的映射关系中所涉及的标签是根据用户提供的习惯用词设置的。因此,本发明实施例提供的方案可以提高标签与用户用词习惯的匹配度。
2、在本发明实施例中,从待设置标签信息的内容中抓取关键词。因此抓取出的关键词可以真实的反映出待设置标签信息所表述的主要内容。
3、在本发明实施例中,在被标记过的目标待选字符串的数量大于1时,需要根据各个样本关键词的优先级顺序,确定出各个目标待选字符串的优先级。并抓取出优先级最高的目标待选字符串作为目标关键词。因此,抓取的目标关键词能够最大限度的满足用户优先级需求。
4、在本发明实施例中,在判断出没有被标记过的待选字符串时,记录各个待选字符串,并根据待选字符串在设定时间区间内的累计被记录次数,确定是否生成将待选字符串设置为样本关键词的添加报告。以使用户可以根据及时根据添加报告判断是否更新样本关键词以及更新与样本关键词具有映射关系的标签。
5、在本发明实施例中,从待设置标签信息的标题中抓取关键词。因此抓取出的关键词可以真实的反映出待设置标签信息的主题。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (4)
1.一种标签设置方法,其特征在于,
根据用户的至少一个习惯用词设置至少一个标签;
建立至少一个样本关键词与至少一个标签之间的映射关系;
还包括:
确定所述用户获取的待设置标签信息;
对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
根据所述映射关系,确定出所述目标关键词对应的标签;
为所述待设置标签信息设置所确定的标签;
所述对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,包括:
获取所述待设置标签信息的内容;
确定所述内容中包括的至少一条语句;
针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
在各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
判断是否存在被标记的目标待选字符串;
如果是,从被标记的目标待选字符串中,抓取所述目标关键词;
所述至少一个样本关键词具有设定的优先级顺序;
所述从被标记的目标待选字符串中,抓取所述目标关键词,包括:
判断被标记的目标待选字符串的数量是否为1;
如果是,抓取被标记的目标待选字符串作为所述目标关键词;
否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词;
进一步包括:
在判断出不存在被标记的目标待选字符串时,
记录所述至少一个目标待选字符串;
针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
2.根据权利要求1所述的方法,其特征在于,
所述对所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词,包括:
获取所述待设置标签信息的标题;
判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
针对每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
判断是否存在被标记的第一待选字符串;
如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
3.一种标签设置装置,其特征在于,
建立模块,用于根据用户的至少一个习惯用词设置至少一个标签;建立至少一个样本关键词与至少一个标签之间的映射关系;
信息确定模块,用于确定所述用户获取的待设置标签信息;
抓取模块,用于对所述信息确定模块获取的所述待设置标签信息进行分词处理,抓取所述待设置标签信息的目标关键词;
标签确定模块,用于根据所述建立模块建立的所述映射关系,确定出所述抓取模块抓取的所述目标关键词对应的标签;
设置模块,用于为所述待设置标签信息设置所述标签确定模块所确定的标签;
所述抓取模块,包括:内容分词子模块、第二判断子模块以及第二抓取子模块;
所述内容分词子模块,用于获取所述待设置标签信息的内容;确定所述内容中包括的至少一条语句;针对每一条所述语句均执行:将当前所述语句划分成至少一个第二待选字符串;其中,每一个所述第二待选字符串包括当前所述语句中的至少两个相邻的字符;
所述第二判断子模块,用于在所述内容分词子模块划分的各个所述第二待选字符串中,选择在所述内容中出现次数最多的至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,判断在所述至少一个样本关键词中是否能查找到当前所述目标待选字符串,如果是,标记当前所述目标待选字符串;
所述第二抓取子模块,用于判断是否存在被所述第二判断子模块标记的目标待选字符串;如果是,从被标记的目标待选字符串中,抓取所述目标关键词;
在所述至少一个样本关键词具有设定的优先级顺序时,
则,所述第二抓取子模块,用于判断被标记的目标待选字符串的数量是否为1;如果是,抓取被标记的目标待选字符串作为所述目标关键词;否则,根据所述优先级顺序,从被标记的目标待选字符串中,抓取优先级最高的目标待选字符串作为所述目标关键词;
所述抓取模块,进一步包括:报告子模块;
所述报告子模块,用于在所述第二抓取子模块判断出不存在被标记的目标待选字符串时,记录所述至少一个目标待选字符串;针对每一个所述目标待选字符串均执行,确定在设定的时间区间内,当前所述目标待选字符串被记录的累计次数;判断所述累计次数是否达到设定的阈值,如果是,生成将当前所述目标待选字符串设置为样本关键词的添加报告。
4.根据权利要求3所述的装置,其特征在于,
所述抓取模块,包括:标题分词子模块、第一判断子模块以及第一抓取子模块;
所述标题分词子模块,用于获取所述待设置标签信息的标题;判断所述标题中包括的字符的数量是否不少于两个,如果是,则将所述标题划分成至少一个第一待选字符串;其中,每一个所述第一待选字符串包括所述标题中的至少两个相邻的字符;
所述第一判断子模块,用于针对所述标题分词子模块划分的每一个所述第一待选字符串均执行:判断在所述至少一个样本关键词中是否能查找到当前所述第一待选字符串,如果是,标记当前所述第一待选字符串;
所述第一抓取子模块,用于判断是否存在被所述第一判断子模块标记的第一待选字符串;如果是,从被标记的第一待选字符串中,抓取所述目标关键词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711407172.0A CN108133012B (zh) | 2017-12-22 | 2017-12-22 | 一种标签设置方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711407172.0A CN108133012B (zh) | 2017-12-22 | 2017-12-22 | 一种标签设置方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108133012A CN108133012A (zh) | 2018-06-08 |
CN108133012B true CN108133012B (zh) | 2022-01-18 |
Family
ID=62391644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711407172.0A Active CN108133012B (zh) | 2017-12-22 | 2017-12-22 | 一种标签设置方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108133012B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111078821B (zh) * | 2019-11-27 | 2023-12-08 | 泰康保险集团股份有限公司 | 字典设置方法、装置、介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101084500A (zh) * | 2004-10-20 | 2007-12-05 | 甲骨文国际公司 | 用于输入和搜索非罗马字母表字符的计算机实现的方法和系统以及相关搜索系统 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN106776590A (zh) * | 2016-12-22 | 2017-05-31 | 北京金山办公软件股份有限公司 | 一种获取词条译文的方法及系统 |
CN107330719A (zh) * | 2017-06-09 | 2017-11-07 | 上海新概念保险经纪有限公司 | 一种保险产品推荐方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030112466A1 (en) * | 2001-12-17 | 2003-06-19 | Leonardi Ricci J. | Duplex pharmacy label and method |
-
2017
- 2017-12-22 CN CN201711407172.0A patent/CN108133012B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101084500A (zh) * | 2004-10-20 | 2007-12-05 | 甲骨文国际公司 | 用于输入和搜索非罗马字母表字符的计算机实现的方法和系统以及相关搜索系统 |
CN106571139A (zh) * | 2016-11-09 | 2017-04-19 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音搜索结果处理方法及装置 |
CN106776590A (zh) * | 2016-12-22 | 2017-05-31 | 北京金山办公软件股份有限公司 | 一种获取词条译文的方法及系统 |
CN107330719A (zh) * | 2017-06-09 | 2017-11-07 | 上海新概念保险经纪有限公司 | 一种保险产品推荐方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于论坛关键字搜索的改进TF-IDF算法及其应用;孙飞;《中国优秀硕士学位论文全文数据库》;20160315;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108133012A (zh) | 2018-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109635296B (zh) | 新词挖掘方法、装置计算机设备和存储介质 | |
CN110020422B (zh) | 特征词的确定方法、装置和服务器 | |
KR101999471B1 (ko) | 정보 추천 방법 및 장치 | |
CN110427884B (zh) | 文档篇章结构识别方法、装置、设备和存储介质 | |
CN105159913B (zh) | 一种待清理文件确定方法及装置 | |
CN111752955A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN111291572A (zh) | 一种文字排版方法、装置及计算机可读存储介质 | |
US20070136220A1 (en) | Apparatus for learning classification model and method and program thereof | |
CN110515896A (zh) | 模型资源管理方法、模型文件制作方法、装置和系统 | |
JP2012198684A (ja) | 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム | |
CN111061837A (zh) | 话题识别方法、装置、设备及介质 | |
CN103324641B (zh) | 信息记录推荐方法和装置 | |
CN110413998B (zh) | 一种面向电力行业的自适应中文分词方法及其系统、介质 | |
CN108133012B (zh) | 一种标签设置方法及装置 | |
CN104090924B (zh) | 一种隐私数据的清理方法和装置 | |
CN110688846A (zh) | 周期词挖掘方法、系统、电子设备及可读存储介质 | |
CN112463795A (zh) | 一种动态哈希方法、装置、设备及存储介质 | |
CN110941605B (zh) | 重复数据的在线删除方法、装置及可读存储介质 | |
CN107590233A (zh) | 一种文件管理方法及装置 | |
CN103093213A (zh) | 视频文件分类方法及终端 | |
CN108694041A (zh) | 数据转换方法、装置及服务终端 | |
CN107169065B (zh) | 一种特定内容的去除方法和装置 | |
CN102378005B (zh) | 运动图像处理装置和运动图像处理方法 | |
CN111177301B (zh) | 一种关键信息识别提取方法及系统 | |
CN114302227A (zh) | 基于容器采集的网络视频采集与解析的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |